数字 - 智狐AI导航

Mistral OCR

Mistral OCR 是 Mistral AI 推出的高效 OCR 工具，支持多语言、多格式文档处理，准确率高达 99.02%。具备结构化输出、高速处理、多模态识别及 Doc-as-prompt 功能，适用于科研、文化遗产保护及企业文档管理等场景。

AI项目与工具 2025年06月12日 76 点赞 0 评论 581 浏览

OKKI

OKKI是小满科技推出的外贸智能工作平台，集成CRM、独立站建站和智能营销等功能，通过AI技术提升客户管理、销售跟进和数据分析效率。支持多渠道客户开发、精细化运营及数据驱动决策，适用于外贸业务员、团队管理者及企业高层，助力企业实现数字化转型和业务增长。

AI项目与工具 2025年06月12日 37 点赞 0 评论 463 浏览

Wan

Wan是阿里推出的AI创意平台，支持AI绘画与视频生成，能根据文字或图片生成高质量艺术图像和动态视频。提供多种风格选择与创意探索功能，用户可保存作品并分享。适用于艺术设计、内容创作、教育学习及商业营销等多个领域，助力提升创作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 544 浏览

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具，支持图像、文本和音频输入，生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能，适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术，提升视频自然度与连贯性，提高内容创作效率。

AI项目与工具 2025年06月12日 66 点赞 0 评论 529 浏览

Heygem

Heygem是一款由硅基智能推出的开源数字人模型，支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音，30秒内完成克隆，60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势，适用于内容创作、教育、直播、影视及客服等多个领域，提供高效、低成本的数字人解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 845 浏览

MIDI

MIDI是一种基于多实例扩散模型的3D场景生成技术，能将单张2D图像快速转化为高保真度的360度3D场景。它通过智能分割、多实例同步扩散和注意力机制，实现高效的3D建模与细节优化。具有良好的泛化能力，适用于游戏开发、虚拟现实、室内设计及文物数字化等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 712 浏览

Tesseract

Tesseract是一款开源的光学字符识别（OCR）引擎，支持多语言识别和多种图像格式。其具备高精度的文字识别能力，适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行，并提供丰富的编程接口和自定义训练功能，便于开发者集成和优化识别效果。

AI项目与工具 2025年06月12日 12 点赞 0 评论 716 浏览

15个AI数字人制作工具，快速生成口播和直播视频

AI数字人通过AI技术模拟真人外貌与行为，实现自然对话与情感表达。本文介绍多款数字人制作工具，支持视频创作、营销推广、教育培训等场景，功能包括3D内容生成、自定义编辑、后期包装等，适用于个人及企业用户，助力内容生产效率提升。

AI项目与工具 2025年06月12日 21 点赞 0 评论 649 浏览

TaoAvatar

TaoAvatar是阿里巴巴推出的高保真、轻量级3D全身虚拟人技术，基于3D高斯溅射（3DGS）实现照片级真实感的虚拟形象生成。支持多模态驱动，具备高帧率实时渲染能力，适用于AR、移动设备及高清显示平台。其轻量级架构结合深度学习优化，提升了运行效率与交互自然度，广泛应用于电商直播、全息通信、虚拟会议、在线教育及娱乐等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 726 浏览

居然设计家

居然设计家是一款融合AI、3D、VR和大数据技术的家装设计平台，提供户型识别、智能设计、自由建模、全屋定制、海量模型资源及AI辅助设计等功能。用户可通过自然语言交互快速生成个性化设计方案，并支持多工具协同与实时渲染，适用于DIY、智能装修、导购、电商等多种场景，提升设计效率与用户体验。

AI项目与工具 2025年06月12日 61 点赞 0 评论 869 浏览

数字

首页

数字

列表

默认

浏览次数

发布日期