教育

博看大模型

博看大模型是吉林外国语大学推出的一款多功能图书馆服务AI,它通过智能对话和信息检索功能,为用户提供了一个方便快捷的图书馆信息获取渠道。

FancyVideo

FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。

百度AI同传

强大的实时同传工具,它通过百度的AI技术,为用户提供实时的语音识别和多语言翻译服务。这款工具不仅提高了跨语言交流的效率,还极大地方便了国际会议、商务洽谈等多语言环境中的...

LyricStudio

LyricStudio是一款利用AI技术辅助歌词创作的工具,能够根据用户设定的主题和风格生成个性化歌词建议,并提供押韵词推荐、歌词结构优化等功能。它支持团队协作创作,兼容多种音乐流派,适用于个人创作、团队协作及教育等多个场景,同时确保用户对生成内容享有完整版权。

ToddlerBot

ToddlerBot是由斯坦福大学开发的开源人形机器人平台,具备30个主动自由度,采用Dynamixel电机,总成本低于6000美元。它支持模拟到现实的零样本迁移,可通过远程操作采集高质量数据,适用于运动控制、强化学习及多机器人协作等研究场景。其高保真数字孪生技术与易维护设计,使其成为科研和教育领域的理想工具。

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具,支持超过30种性别和语言的声音选择,用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件,适用于产品演示、教育培训、营销推广等多种场景,助力高效生成高质量语音内容。

MyShell

MyShell是一个全面的AI应用开发平台,提供了经典、开发和无代码三种模式,适合各种技能水平的用户。该平台支持创建AI原生应用,并通过AI代理商店提供多模态应用,涵盖效率工具、教育应用、游戏和客户服务等多个领域。平台还设有激励机制,鼓励创作者和用户参与,同时倡导使用开源模型,确保创作者和用户能够公平地分享收益。

PodLM

PodLM是一款利用先进AI技术打造的播客生成工具,能够将网页内容、文本或文档快速转化为高质量的播客节目。其主要功能包括自动脚本生成、一键式网页转播客、文本转播客以及多样化的AI语音定制选项。PodLM还支持多角色语音合成及背景音乐集成,适用于个人创作者、教育机构、新闻媒体和企业等多个领域,显著提升了内容传播效率。

MMSearch

MMSearch 是一款用于评估大型多模态模型(LMMs)搜索能力的基准测试工具,包含 MMSearch-Engine 框架和 MMSearch 测试集。其核心功能包括问题重构、网页排序和答案总结,通过多模态搜索能力评估提升 LMMs 的性能。实验结果显示 GPT-4o 在该测试中表现优异,且增加计算量比扩大模型规模更具优势。