AI仓库-资源分类导航
次级导航
  • 专业导航
  • 文章资讯
  • 游戏导航
    • 二级菜单样式
  • 软件导航
  • AI工具导航
  • 在线工具
  • 今日热榜
  • 排行榜
    • 专业导航
    • 文章资讯
    • 游戏导航
      • 二级菜单样式
    • 软件导航
    • AI工具导航
    • 在线工具
    • 今日热榜
    • 排行榜

    AI开源项目

    共 98 篇网址
    排序
    发布更新浏览点赞
    MotionCtrl

    MotionCtrl

    强大的视频生成工具,它通过精确控制视频中的相机和物体运动,为视频制作带来了新的可能性。无论是简单的运动场景还是复杂的交互动作,MotionCtrl都能够提供令人满意的解决方案。
    05820
    AI开源项目# AI开源项目# 人工智能# 动画制作
    Make-A-Character

    Make-A-Character

    创新的3D角色生成框架,它通过文本描述快速创建逼真的3D角色,具有高度的定制性和逼真度。它结合了最新的人工智能技术,提供了一个直观、灵活且高效的角色创建解决方案,适用于多...
    04530
    AI开源项目# 3D建模# AI开源项目# CG技术
    MIMO

    MIMO

    创新的AI框架,它通过空间分解建模技术,提供了一种先进的可控角色视频合成方法。
    07370
    AI开源项目# 3D感知合成# AI开源项目# AI框架
    美图奇想大模型

    美图奇想大模型

    提升了视频和图像的生成质量,广泛应用于影像美化、视频剪辑、电商设计、口播视频制作、广告营销和游戏设计等多个领域
    05930
    AI开源项目# AI开源项目# AI视觉模型# 图像生成
    SafeEar

    SafeEar

    创新的音频伪造检测工具,它通过先进的AI技术保护用户的语音隐私,同时提供高效的伪造音频检测能力。
    05090
    AI开源项目# AI开源项目# AI框架# 多语言支持
    PDF2Audio

    PDF2Audio

    通过将PDF文档转换成音频内容,为用户提供了一种新的信息消费方式。无论是教育、播客制作还是无障碍访问,PDF2Audio都能满足多样化的需求。
    08430
    AI开源项目# AI开源项目# PDF转音频# 信息消费
    MetaGPT

    MetaGPT

    一个创新的多智能体编程框架,它通过模拟人类工作流程和采用标准化操作程序来提高代码生成的质量和效率。该框架特别适合解决复杂的软件开发任务,并为自动化编程和多智能体协作提...
    07830
    AI开源项目# AI开源项目# 代码生成# 元编程框架
    DiffusionGPT

    DiffusionGPT

    一个创新的文本到图像生成系统,它通过结合大语言模型的解析能力和领域专家模型的生成能力,实现了从多样化文本提示到高质量图像的高效转换。
    05530
    AI开源项目# AI开源项目# 人类反馈优化# 优势数据库
    OLMo

    OLMo

    一个开放的语言模型框架,它为研究人员和开发者提供了一套完整的工具和资源,以促进AI和语言模型的共同进步。
    07770
    AI开源项目# AI开源项目# AI研究工具# 开放语言模型
    IP-Adapter

    IP-Adapter

    一个强大的工具,它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效,易于部署和使用,同时支持广泛的应用场景,包括图像生成、转换和修复。通过解耦的交叉...
    06720
    AI开源项目# AI开源项目# 图像生成# 图像编码
    Follow Your Pose

    Follow Your Pose

    一个创新的文本到视频生成框架,它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频,还能让用户通过姿态序列精确控制视频中角色的动作...
    08510
    AI开源项目# AI开源项目
    Lepton Search

    Lepton Search

    一个功能强大、易于使用的对话式AI搜索引擎,它提供了一个开源的平台,允许用户构建和运行自定义的搜索和AI应用。通过集成大语言模型和搜索引擎,Lepton Search能够提供快速准确的...
    07450
    AI开源项目# AI开源项目# 大语言模型# 对话式AI
    abab-music-1

    abab-music-1

    一个强大的AI音乐生成工具,它通过先进的技术,使得音乐创作更加便捷和高效。无论是专业的音乐制作人还是业余爱好者,都能够利用这个模型来创作出高质量的音乐作品。
    07910
    AI开源项目# AI开源项目# AI音乐生成# 业余音乐制作
    FineVideo

    FineVideo

    是一个多模态视频数据集,它为AI模型提供了丰富的上下文信息,使其能够更深入地理解视频内容。这个数据集在视频内容分析、情绪分析、故事叙述理解、媒体编辑和多模态学习等领域具...
    05880
    AI开源项目# AI开源项目# 元数据标注# 场景分割
    Void

    Void

    它通过集成AI功能,为用户提供了一个高效、智能的编程和文本编辑环境。无论是代码开发还是文本编辑,Void都能提供强大的支持和便捷的操作。
    04700
    AI开源项目# AI开源项目# AI集成# VS Code分支
    Vary-toy

    Vary-toy

    一个小型但功能强大的视觉语言模型,它使得资源有限的研究者和开发者也能体验到先进的视觉语言模型功能。
    07790
    AI开源项目# AI开源项目# 图像描述# 多模态交互
    Draw an Audio

    Draw an Audio

    创新的视频生成音频系统,它通过先进的AI技术,能够自动分析视频内容并生成与之匹配的声音效果。
    08650
    AI开源项目# AI开源项目# 人工智能# 声音设计
    RapidPages

    RapidPages

    一个开源的集成开发环境(IDE),专注于利用人工智能技术快速生成React和Tailwind CSS的UI组件。
    04730
    AI开源项目# AI开源项目# AI驱动# 开源IDE
    ActAnywhere

    ActAnywhere

    一个强大的视频生成工具,它通过自动化的前景与背景融合技术,极大地简化了视频背景生成的过程。它的应用场景广泛,从电影制作到教育,都能提供高效、创新的解决方案。
    07560
    AI开源项目# AI开源项目# 交互式视频编辑# 人工智能
    DemoFusion

    DemoFusion

    强大的高分辨率图像生成框架,它通过渐进式上采样、跳跃残差和扩张采样机制,实现了在不进行额外训练和不产生过高内存需求的情况下,将模糊的低分辨率图像变得更加高清。它易于使...
    08050
    AI开源项目# AI开源项目# AI生成# 图像放大
    Ovis1.6

    Ovis1.6

    强大的多模态大模型,它通过创新的架构设计和全面的数据优化,在多模态任务上展现了卓越的性能。
    08580
    AI开源项目# AI开源项目
    Gummy

    Gummy

    创新的语音翻译大模型,它通过端到端的设计和深度学习技术,实现了高质量的实时语音翻译。无论是在国际会议、教育培训、旅游导航还是客户服务和医疗咨询等场景中,Gummy都能提供高...
    07490
    AI开源项目# AI开源项目
    Real-ESRGAN

    Real-ESRGAN

    一个强大的图像超分辨率工具,它利用深度学习和生成对抗网络,在没有真实高分辨率图像作为参考的情况下,通过合成退化过程来提升低分辨率图像的质量。
    07220
    AI开源项目# AI开源项目# GAN技术# U-Net判别器
    DDColor

    DDColor

    用户可以轻松上传黑白图片,快速获得彩色结果,无论是对于修复老照片还是为动漫风景上色,DDColor都能提供令人满意的效果。
    07610
    AI开源项目# AI图像着色# AI开源项目# 图像修复
    Screenshot to Code

    Screenshot to Code

    无论是在线使用还是本地部署,它都为用户提供了灵活、高效的代码生成解决方案。此外,通过提供编辑功能和代码导出,它满足了用户对代码调整和个性化的需求。
    07650
    AI开源项目# AI开源项目# API集成# 人工智能
    cogvlm2-llama3-caption

    cogvlm2-llama3-caption

    强大的视频描述生成工具,通过先进的多模态处理和上下文感知能力,为用户提供了一种快速理解视频内容的方法。它的实时处理能力和定制化描述功能,使其在多种应用场景中都非常有用。
    07630
    AI开源项目# AI开源项目
    AnyText

    AnyText

    一个创新的多语言视觉文本生成和编辑工具,利用先进的扩散模型技术,能够准确生成和编辑图像中的文本。它不仅支持多种语言和文本风格,还能在复杂的图像背景中保持文本的清晰度和...
    07810
    AI开源项目# AI开源项目# 图像融合# 多语言文本生成
    Motionshop

    Motionshop

    一个创新的AI角色动画框架,通过将视频中的人物替换为3D化身,实现了现实与虚拟的无缝融合。它利用多种先进技术,提供高质量的动画效果,极大地丰富了视频内容的表现形式。
    07460
    AI开源项目# 3D渲染# 3D角色替换# AI开源项目
    MagicVideo-V2

    MagicVideo-V2

    一个创新的AI视频生成框架,它通过集成多个模块来生成高质量的视频内容。它不仅提高了视频生成的效率和质量,还确保了视频画面的流畅和逼真,为用户提供了极佳的观看体验。
    04940
    AI开源项目# AI开源项目# AI视频生成# 多阶段生成
    I2VGen-XL:阿里推出的图生视频模型

    I2VGen-XL:阿里推出的图生视频模型

    一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视...
    05090
    AI开源项目# AI开源项目# 图像到视频生成# 开源模型
    加载更多

    标签云

    AI仓库-资源分类导航
    AI仓库(AICANGKU)-资源分类导航—— 这里致力于成为您数字生活的强大助手!无论您是学生、职场人士、设计师、开发者,还是热爱生活、追求效率与乐趣的探索者,我们精心筛选和整理了互联网上最实用、最新鲜的资源,只为让您省时、省力、更省心。

    友链申请 免责声明 安全提醒 关于我们 联系删除

    AI仓库-资源分类导航
    国家反诈中心APPAI仓库-资源分类导航
    国家反诈中心APP
    Copyright © 2025 AI仓库-资源分类导航 黔ICP备17011954号-2 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍