AI项目与工具

海豚AI配音

海豚AI配音是一款支持多语言、多音色的文本转语音工具,提供超过500种真人音色和1000多种二次元音色,适用于有声书、自媒体、教育、动漫及广告等领域。支持多人配音、声音克隆、变声等功能,操作简便,适合各类内容创作者提升作品质量。

Sketch2Sound

Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术,通过提取响度、亮度和音高概率等控制信号,结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架,同时赋予声音设计师更强的表达力与可控性,广泛适用于电影、游戏、音乐制作及教育等多个领域。

RepText

RepText是一款由Shakker Labs与Liblib AI联合开发的多语言视觉文本渲染框架,采用字形模仿技术实现高质量文本生成。支持多种语言及复杂排版,具备精准控制、高效兼容和自然融合等特点,广泛应用于平面设计、艺术创作和数字内容生产等领域。

Ideogram Canvas

Ideogram Canvas是一款基于AI技术的创意画布工具,支持用户在一个无限制的虚拟画布上生成、编辑及合并图像。其核心功能包括Magic Fill和Extend,可实现图像局部修改与扩展,同时保持风格统一。适用于平面设计、品牌营销、内容创作、艺术设计及教育培训等多个领域,助力提升创意工作效率。

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型,能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型(LRM)设计,采用先进的图像编码、三平面NeRF表示及优化训练策略,支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域,具有高效、高精度和广泛适用性的特点。

GPDiT

GPDiT是一种由多所高校和企业联合开发的视频生成模型,结合了扩散模型与自回归模型的优势,具备高质量视频生成、视频表示学习、少样本学习和多任务处理能力。其核心技术包括轻量级因果注意力机制和无参数的旋转基时间条件策略,提升了生成效率与质量。该模型适用于视频创作、编辑、内容理解及创意生成等多种应用场景。

CursorCore

CursorCore 是一款基于大型语言模型的编程辅助工具,通过对话式交互支持代码补全、修改和错误修复。它整合代码历史、上下文信息及用户指令,利用自动化数据生成管道和基准测试优化模型性能,适用于日常编码、代码审查、教学学习及遗留代码维护等多个场景。

幕布

幕布是一款AI驱动的大纲笔记工具,支持结构化知识整理与一键生成思维导图,帮助用户更高效地理解和记忆信息。其功能涵盖任务拆解、团队协作、多平台同步及Markdown编辑等,适用于学习、工作与会议管理等多种场景,提升信息处理效率与组织能力。

Company Research Agent

Company Research Agent是一款基于多智能体框架的公司研究工具,支持一键生成全面的公司研究报告。它从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息,并利用Gemini 2.0 Flash和GPT-4.1-mini模型进行高语境研究综合与精确报告格式化。该工具具备AI内容过滤功能,确保信息的相关性和准确性,并通过WebSocket实现实时进度更新,提升研究效率和用户体验

Lobe Vidol

Lobe Vidol是一个开源的数字人创作平台,支持用户轻松创建和定制虚拟偶像。它具备流畅的对话交互、背景设定、动作库、角色编辑功能,还支持MMD舞蹈和PMX舞台加载。通过TTS与STT技术,Lobe Vidol实现了语音与文本的双向转换,提供沉浸式用户体验。 ---