AI仓库-资源分类导航
次级导航
  • 专业导航
  • 文章资讯
  • 游戏导航
    • 二级菜单样式
  • 软件导航
  • AI工具导航
  • 在线工具
  • 今日热榜
  • 排行榜
    • 专业导航
    • 文章资讯
    • 游戏导航
      • 二级菜单样式
    • 软件导航
    • AI工具导航
    • 在线工具
    • 今日热榜
    • 排行榜

    AI开源项目

    共 98 篇网址
    排序
    发布更新浏览点赞
    TextDiffuser-2

    TextDiffuser-2

    一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。
    08770
    AI开源项目# AI图像生成# AI开源项目# 内容创造
    MMMLU

    MMMLU

    重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。
    08720
    AI开源项目# AI开源项目# AI模型评估# 国际化业务
    EchoMimic

    EchoMimic

    一个强大的音频驱动肖像动画生成工具,它通过创新的训练策略和多驱动方式,能够在多种场景下生成高质量、逼真的肖像动画
    08710
    AI开源项目# AI开源项目
    Draw an Audio

    Draw an Audio

    创新的视频生成音频系统,它通过先进的AI技术,能够自动分析视频内容并生成与之匹配的声音效果。
    08640
    AI开源项目# AI开源项目# 人工智能# 声音设计
    SFR-RAG

    SFR-RAG

    先进的大型语言模型,它通过强化对上下文的理解,提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域,SFR-RAG都能提供高质量的文...
    08580
    AI开源项目# AI开源项目# 上下文理解# 函数调用
    Ovis1.6

    Ovis1.6

    强大的多模态大模型,它通过创新的架构设计和全面的数据优化,在多模态任务上展现了卓越的性能。
    08560
    AI开源项目# AI开源项目
    Follow Your Pose

    Follow Your Pose

    一个创新的文本到视频生成框架,它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频,还能让用户通过姿态序列精确控制视频中角色的动作...
    08510
    AI开源项目# AI开源项目
    DreaMoving

    DreaMoving

    一个强大的视频生成框架,通过其创新的Video ControlNet和Content Guider,实现了对视频内容的高度控制
    08450
    AI开源项目# AI开源项目
    PDF2Audio

    PDF2Audio

    通过将PDF文档转换成音频内容,为用户提供了一种新的信息消费方式。无论是教育、播客制作还是无障碍访问,PDF2Audio都能满足多样化的需求。
    08430
    AI开源项目# AI开源项目# PDF转音频# 信息消费
    AnimateDiff

    AnimateDiff

    通过预训练的运动建模模块,使得用户能够轻松地创作出丰富多样的动画内容,同时保持了原有模型的风格和特性。它的跨领域应用性和易于集成的特点,极大地扩展了个性化动画的创作空间。
    08380
    AI开源项目# AI开源项目# Transformer模型# 个性化内容生成
    Clapper

    Clapper

    一个创新的AI视频创作工具,它通过提供一个交互式和直观的创作平台,降低了视频制作的门槛
    08340
    AI开源项目# AI开源项目
    Llama 3.2

    Llama 3.2

    在图像理解和文本处理任务上展现出卓越的性能,并通过定制化微调和本地部署,推动了AI技术的开放性和可访问性。
    08180
    AI开源项目# AI大模型# AI开源项目# 图像理解
    PortraitGen

    PortraitGen

    AI人像视频编辑工具,它通过先进的技术实现了对视频中人物的高质量编辑。无论是在影视制作、艺术创作、广告宣传、时尚展示、社交媒体还是游戏开发等领域,PortraitGen都能提供高效...
    08100
    AI开源项目# 3D高斯溅射# AI开源项目# AI视频编辑
    Animate Anyone

    Animate Anyone

    一个功能强大且易于使用的图像到视频角色动画合成框架。它通过实时动画合成技术和用户友好的界面,使得动画制作变得更加简单和快捷。
    08100
    AI开源项目# AI开源项目# AI技术# 交互体验
    Snap Video

    Snap Video

    强大的文本到视频合成工具,它通过创新的技术架构和高效的深度学习模型,实现了高质量视频内容的生成。这款工具不仅在视频生成领域具有突破性,还为用户提供了一种全新的创作和表...
    08090
    AI开源项目# AI开源项目# AI视频合成# Transformer架构
    HivisionIDPhotos

    HivisionIDPhotos

    HivisionIDPhotos是一个功能全面、操作简便的AI证件照制作工具。它不仅能够满足用户对证件照的基本制作需求,还提供了人像抠图、底色添加、排版照生成等高级功能
    08080
    AI开源项目# AI开源项目
    DemoFusion

    DemoFusion

    强大的高分辨率图像生成框架,它通过渐进式上采样、跳跃残差和扩张采样机制,实现了在不进行额外训练和不产生过高内存需求的情况下,将模糊的低分辨率图像变得更加高清。它易于使...
    08040
    AI开源项目# AI开源项目# AI生成# 图像放大
    UniEdit

    UniEdit

    UniEdit 是一个强大的视频编辑工具,它通过利用预训练的文本到视频生成器,在无需调优的情况下,提供了一种简单而有效的方法来编辑视频的运动和外观。
    08030
    AI开源项目# AI开源项目# 文本驱动编辑# 无需调优
    abab-music-1

    abab-music-1

    一个强大的AI音乐生成工具,它通过先进的技术,使得音乐创作更加便捷和高效。无论是专业的音乐制作人还是业余爱好者,都能够利用这个模型来创作出高质量的音乐作品。
    07900
    AI开源项目# AI开源项目# AI音乐生成# 业余音乐制作
    MetaGPT

    MetaGPT

    一个创新的多智能体编程框架,它通过模拟人类工作流程和采用标准化操作程序来提高代码生成的质量和效率。该框架特别适合解决复杂的软件开发任务,并为自动化编程和多智能体协作提...
    07830
    AI开源项目# AI开源项目# 代码生成# 元编程框架
    AnyText

    AnyText

    一个创新的多语言视觉文本生成和编辑工具,利用先进的扩散模型技术,能够准确生成和编辑图像中的文本。它不仅支持多种语言和文本风格,还能在复杂的图像背景中保持文本的清晰度和...
    07810
    AI开源项目# AI开源项目# 图像融合# 多语言文本生成
    Vary-toy

    Vary-toy

    一个小型但功能强大的视觉语言模型,它使得资源有限的研究者和开发者也能体验到先进的视觉语言模型功能。
    07780
    AI开源项目# AI开源项目# 图像描述# 多模态交互
    ScreenAgent

    ScreenAgent

    一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
    07770
    AI开源项目# AI开源项目# ScreenAgent# VLM
    OLMo

    OLMo

    一个开放的语言模型框架,它为研究人员和开发者提供了一套完整的工具和资源,以促进AI和语言模型的共同进步。
    07760
    AI开源项目# AI开源项目# AI研究工具# 开放语言模型
    DeepTranslate

    DeepTranslate

    一款功能强大、使用便捷的免费AI双语页面翻译浏览器插件。它支持多种语言和翻译API,能够满足用户在不同场景下的翻译需求
    07650
    AI开源项目# AI开源项目# AI浏览器插件
    Screenshot to Code

    Screenshot to Code

    无论是在线使用还是本地部署,它都为用户提供了灵活、高效的代码生成解决方案。此外,通过提供编辑功能和代码导出,它满足了用户对代码调整和个性化的需求。
    07650
    AI开源项目# AI开源项目# API集成# 人工智能
    cogvlm2-llama3-caption

    cogvlm2-llama3-caption

    强大的视频描述生成工具,通过先进的多模态处理和上下文感知能力,为用户提供了一种快速理解视频内容的方法。它的实时处理能力和定制化描述功能,使其在多种应用场景中都非常有用。
    07630
    AI开源项目# AI开源项目
    DDColor

    DDColor

    用户可以轻松上传黑白图片,快速获得彩色结果,无论是对于修复老照片还是为动漫风景上色,DDColor都能提供令人满意的效果。
    07600
    AI开源项目# AI图像着色# AI开源项目# 图像修复
    GameNGen

    GameNGen

    由谷歌推出的世界首个完全由AI驱动的游戏引擎,旨在颠覆传统的游戏开发方式。这个引擎利用神经网络实时生成游戏画面,无需手动编写代码
    07570
    AI开源项目# AI开源项目
    ActAnywhere

    ActAnywhere

    一个强大的视频生成工具,它通过自动化的前景与背景融合技术,极大地简化了视频背景生成的过程。它的应用场景广泛,从电影制作到教育,都能提供高效、创新的解决方案。
    07560
    AI开源项目# AI开源项目# 交互式视频编辑# 人工智能
    加载更多

    标签云

    AI仓库-资源分类导航
    AI仓库(AICANGKU)-资源分类导航—— 这里致力于成为您数字生活的强大助手!无论您是学生、职场人士、设计师、开发者,还是热爱生活、追求效率与乐趣的探索者,我们精心筛选和整理了互联网上最实用、最新鲜的资源,只为让您省时、省力、更省心。

    友链申请 免责声明 安全提醒 关于我们 联系删除

    AI仓库-资源分类导航
    国家反诈中心APPAI仓库-资源分类导航
    国家反诈中心APP
    Copyright © 2025 AI仓库-资源分类导航 黔ICP备17011954号-2 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍