学习

BiliNote

BiliNote 是一款开源 AI 视频笔记工具,支持从多个平台导入视频链接并生成结构化的 Markdown 笔记。具备音频转写、大模型总结、截图插入、内容跳转链接等功能,适用于学习、创作、培训等场景。采用 FastAPI 和 React 技术栈,支持 Docker 部署,便于用户快速集成与使用。

Knowee AI

一个AI驱动的学习助手,前身为StudyGPT。Knowee AI提供即时AI响应、测验生成、写作任务支持和YouTube内容总结等功能。

ELSA Speak

ELSA Speak是一款AI驱动的英语学习工具,专注于提升用户的发音、语法、词汇及沟通能力。它提供即时发音反馈、个性化学习计划、水平评估测试以及趣味化学习内容,适用于个人学习、课堂教学、企业培训等多种场景,助力用户在学术和职业发展中提升英语水平。

喜娜AI助手

喜娜AI助手是新浪财经推出的智能工具,具备AI摘要和个股公告解读两大功能。AI摘要可快速提炼财经新闻核心信息,帮助用户高效掌握公司业务、财务状况及行业动态;个股公告解读则基于深度学习技术,对A股公告进行专业分析,识别关键数据并用可视化方式标注风险与机会,提升信息理解效率,助力用户做出更明智的投资决策。

KuaiMod

KuaiMod 是快手开发的多模态大模型内容审核系统,能高效识别和过滤有害及低质量视频。它结合视觉语言模型(VLM)和链式推理(CoT)技术,支持动态策略更新和强化学习,提升审核准确性。系统在离线测试中准确率达92.4%,有效降低用户举报率,优化推荐体验,助力平台内容生态健康发展。

Notebook Copilot

有了 Notebook CoPilot,开发笔记本的过程变得更加容易。这个简单的工具可以毫不费力地根据您的输入生成代码和 Markdown 单元格,从而显着简化您的工作流程。

Ola

Ola是一款由多机构联合开发的全模态语言模型,支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略,逐步扩展模型的多模态理解能力,同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器,结合局部-全局注意力机制,实现高效多模态处理,在多项任务中表现优异。

MegaTTS 3

MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统,采用轻量级扩散模型,支持中英文及混合语音合成,具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模,可快速生成高质量语音,适用于教育、内容制作、语音交互等多个领域。

Phantom

Phantom是由字节跳动研发的视频生成框架,支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术,结合文本和图像提示,实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能,适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练,具备强大的跨模态理解和生成能力。