学习

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集,包含1000亿个图像与文本配对数据,是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建,保留了丰富的语言和文化多样性,支持多模态任务如图像分类、图像描述生成和视觉问答,广泛应用于人工智能研究、工程开发及教育领域。

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具,支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能,兼容U-Net和DiT架构,并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程,提升生成质量与可控性,适用于内容创作、电影制作、广告营销、教育培训等多个领域。

Stable Diffusion-AI辅助设计

64课时带领大家系统完成SD的全流程学习,并精讲一款让SD从玩具升级到强大生产力工具的热门插件—ControlNet的使用。

AudioJam

AudioJam是一款基于AI技术的音乐分析与编辑工具,提供和弦音调分析、乐器伴奏分离、变速播放、AB循环等功能,支持从歌曲中提取人声与各类乐器音轨并调节音量。其高精度和弦识别(准确率超90%)为音乐创作、学习和教学提供了强大支持,适用于多平台(Mac、Windows、iOS、Android、Web),是提升音乐学习与创作效率的理想选择。 ---

OpenAI Academy

OpenAI Academy是OpenAI推出的免费AI学习平台,提供多样化的课程和直播活动,涵盖从基础到高级的AI技能。课程内容包括AI教学、科研应用、开发者进阶等,适合教育工作者、学生、技术人员及普通学习者。平台还注重AI在公益和社会服务中的实际应用,致力于推动AI技术的普及与落地。

Lingolette

Lingolette是一款利用AI技术打造的语言学习平台,专注于通过实时对话和个性化学习路径提升用户的外语口语与书面表达能力。平台支持多种语言(如英语、法语、德语等),并结合沉浸式场景、逐步指导和每日更新的内容激发学习动力。此外,它适合个人、教育机构、职场人士及企业团队使用,满足多样化的学习需求。

Offline Chat

Offline Chat是一款专为iOS设备设计的离线AI聊天应用程序。它支持完全在本地运行,无需网络连接,确保用户数据的安全和隐私。用户可以加载和查询私人文档,并且可以选择不同性能的AI模型。这款应用适用于商务、学习和旅行等多种场景,是注重隐私保护和便携性的理想助手。

Mathos AI

Mathos AI是一款先进的AI数学工具,覆盖从基础到高级数学领域的多种问题,提供逐步解析、个性化辅导、PDF作业分析及多设备同步等功能。它支持图像识别、语音输入和高级图形计算,旨在优化用户的学习体验,提升解题效率。