AI仓库-资源分类导航
次级导航
  • 专业导航
  • 文章资讯
  • 游戏导航
    • 二级菜单样式
  • 软件导航
  • AI工具导航
  • 在线工具
  • 今日热榜
  • 排行榜
    • 专业导航
    • 文章资讯
    • 游戏导航
      • 二级菜单样式
    • 软件导航
    • AI工具导航
    • 在线工具
    • 今日热榜
    • 排行榜

    AI开源项目

    共 98 篇网址
    排序
    发布更新浏览点赞
    MinerU

    MinerU

    一个功能强大的PDF内容提取工具,通过其多模态内容处理、结构和格式保留、公式识别与转换、干扰元素去除、乱码识别与处理以及高质量解析工具链等主要功能,能够高效地从PDF文档中...
    04480
    AI开源项目# AI开源项目
    Tailor

    Tailor

    一款集视频剪辑、生成和优化功能于一身的智能视频处理工具,凭借其简单易用的操作方式、强大的功能和智能高效的处理能力
    05970
    AI开源项目# AI开源项目
    EMO

    EMO

    一个创新的音频驱动肖像视频生成工具,凭借其简单的输入方式、丰富的表情生成能力、多语言支持以及对多种肖像风格的兼容性
    05000
    AI开源项目# AI开源项目
    eSearch

    eSearch

    一款综合性的屏幕识别和搜索工具,它通过集成多种实用功能,为用户提供了一个便捷的工作流程,从截图到文本识别,再到信息搜索和翻译,eSearch都能够提供高效的解决方案
    04600
    AI开源项目# AI开源项目
    HivisionIDPhotos

    HivisionIDPhotos

    HivisionIDPhotos是一个功能全面、操作简便的AI证件照制作工具。它不仅能够满足用户对证件照的基本制作需求,还提供了人像抠图、底色添加、排版照生成等高级功能
    08080
    AI开源项目# AI开源项目
    SUPIR

    SUPIR

    一款功能强大且多用途的图像恢复工具,它通过结合AI技术和文本驱动的智能恢复,能够为用户提供高保真度的图像恢复服务
    06180
    AI开源项目# AI开源项目
    SeedEdit

    SeedEdit

    一款功能强大且创新的图像编辑工具,它通过先进的扩散模型技术,实现了对图像的高精度和高审美的编辑
    07380
    AI开源项目# AI开源项目
    OmniGen

    OmniGen

    创新的统一图像生成模型,它通过简化架构和整合多种图像生成任务,为用户提供了一个强大而灵活的工具。它不仅能够处理文本到图像的生成,还能够执行图像编辑、主题驱动生成和视觉...
    07530
    AI开源项目# AI开源项目# 多任务图像处理框架# 多模态输入支持
    UniEdit

    UniEdit

    UniEdit 是一个强大的视频编辑工具,它通过利用预训练的文本到视频生成器,在无需调优的情况下,提供了一种简单而有效的方法来编辑视频的运动和外观。
    08030
    AI开源项目# AI开源项目# 文本驱动编辑# 无需调优
    StarCoder 2

    StarCoder 2

    一个强大的代码生成和理解工具,它通过大规模训练和多样化的模型规模,为开发者提供了一个高性能的编程辅助平台。
    07460
    AI开源项目# AI开源项目# AI编程# 代码理解
    Snap Video

    Snap Video

    强大的文本到视频合成工具,它通过创新的技术架构和高效的深度学习模型,实现了高质量视频内容的生成。这款工具不仅在视频生成领域具有突破性,还为用户提供了一种全新的创作和表...
    08090
    AI开源项目# AI开源项目# AI视频合成# Transformer架构
    TextDiffuser-2

    TextDiffuser-2

    一个功能强大的图像生成工具,它通过扩散模型技术,根据文本描述生成高质量的图像。这个工具为用户提供了一种创新的方式来探索和实现他们的创意视觉概念。
    08770
    AI开源项目# AI图像生成# AI开源项目# 内容创造
    ChatMusician

    ChatMusician

    通过结合先进的大型语言模型和音乐表示法,为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐,还能理解和回答音乐理论问题,为音乐教育和创作提供了新的可能性。
    06630
    AI开源项目# AI开源项目# 和弦生成# 多模态交互
    EMO

    EMO

    EMO通过其先进的音频驱动视频生成技术,为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情,还能根据音频内容自然地驱动头部动作,为...
    06370
    AI开源项目# AI开源项目# AI视频生成# 动态帧过渡
    OpenCodeInterpreter

    OpenCodeInterpreter

    通过结合大型语言模型和代码执行反馈,提供了一个强大的工具,可以帮助开发者在软件开发过程中提高效率和质量。
    05590
    AI开源项目# AI开源项目# 交互式代码开发# 人工智能编程辅助
    ConsiStory

    ConsiStory

    它提供了一种快速、高效且训练无关的方法来生成一致性图像,特别适用于需要保持主题一致性的应用场景。它不仅能够处理单主题场景,还能够应对多主题挑战,并与现有的图像编辑工具...
    05910
    AI开源项目# AI开源项目
    ScreenAgent

    ScreenAgent

    一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。
    07770
    AI开源项目# AI开源项目# ScreenAgent# VLM
    GPT-SoVITS

    GPT-SoVITS

    一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。
    05190
    AI开源项目# AI开源项目# 个性化助手# 人工智能
    DiT

    DiT

    创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。
    06250
    AI开源项目# AI开源项目# Transformer架构# 上下文条件
    VideoPoet

    VideoPoet

    强大的AI视频生成工具,它通过大型语言模型架构和多模态输入处理能力,实现了从文本到视频的转换、图像动画生成、视频风格化、视频编辑和音频生成等多种功能。
    05680
    AI开源项目# AI开源项目# AI视频合成# Transformer架构
    onewebot2

    onewebot2

    易于使用的微信AI机器人软件包,它通过简化的配置流程和一键运行功能,使得用户能够快速启动和运行微信机器人。无论是个人还是企业,都能通过oneWebot2创建智能助手,实现自动化服务
    05780
    AI开源项目# AI开源项目# API集成# 一键运行
    SFR-RAG

    SFR-RAG

    先进的大型语言模型,它通过强化对上下文的理解,提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域,SFR-RAG都能提供高质量的文...
    08580
    AI开源项目# AI开源项目# 上下文理解# 函数调用
    Boximator

    Boximator

    强大的视频合成工具,它通过创新的框约束机制和自跟踪技术,实现了对视频中对象运动的精细控制。这使得它在电影制作、游戏开发、VR/AR内容创作等领域具有广泛的应用潜力。
    07470
    AI开源项目# AI开源项目# 交互式视频# 人工智能
    Depth Anything

    Depth Anything

    强大的单目深度估计工具,它通过利用大规模未标注数据和先进的数据增强技术,实现了在多种复杂环境下的准确深度预测。其多任务学习和语义辅助功能使其在多个领域都有广泛的应用潜力。
    04810
    AI开源项目# 3D建模# AI开源项目# AR/VR融合
    GOT-OCR2.0

    GOT-OCR2.0

    创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。
    06930
    AI开源项目# AI开源项目# 交互式OCR# 光学字符识别
    V-JEPA

    V-JEPA

    创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。
    04760
    AI开源项目# AI开源项目# Transformer模型# 多模态学习
    MMMLU

    MMMLU

    重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。
    08720
    AI开源项目# AI开源项目# AI模型评估# 国际化业务
    PortraitGen

    PortraitGen

    AI人像视频编辑工具,它通过先进的技术实现了对视频中人物的高质量编辑。无论是在影视制作、艺术创作、广告宣传、时尚展示、社交媒体还是游戏开发等领域,PortraitGen都能提供高效...
    08100
    AI开源项目# 3D高斯溅射# AI开源项目# AI视频编辑
    MotionCtrl

    MotionCtrl

    强大的视频生成工具,它通过精确控制视频中的相机和物体运动,为视频制作带来了新的可能性。无论是简单的运动场景还是复杂的交互动作,MotionCtrl都能够提供令人满意的解决方案。
    05820
    AI开源项目# AI开源项目# 人工智能# 动画制作
    AnimateDiff

    AnimateDiff

    通过预训练的运动建模模块,使得用户能够轻松地创作出丰富多样的动画内容,同时保持了原有模型的风格和特性。它的跨领域应用性和易于集成的特点,极大地扩展了个性化动画的创作空间。
    08380
    AI开源项目# AI开源项目# Transformer模型# 个性化内容生成
    加载更多

    标签云

    AI仓库-资源分类导航
    AI仓库(AICANGKU)-资源分类导航—— 这里致力于成为您数字生活的强大助手!无论您是学生、职场人士、设计师、开发者,还是热爱生活、追求效率与乐趣的探索者,我们精心筛选和整理了互联网上最实用、最新鲜的资源,只为让您省时、省力、更省心。

    友链申请 免责声明 安全提醒 关于我们 联系删除

    AI仓库-资源分类导航
    国家反诈中心APPAI仓库-资源分类导航
    国家反诈中心APP
    Copyright © 2025 AI仓库-资源分类导航 黔ICP备17011954号-2 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍