AI项目与工具

DreamO

DreamO是由字节跳动与北京大学联合开发的图像定制生成框架,基于扩散变换器(DiT)模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成,具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景,具备广泛的适用性和技术先进性。

蜜小语

蜜小语是一款专注于提升聊天体验的移动应用,提供蜜语键盘、聊天标签和热度调节等功能,帮助用户在恋爱、职场、朋友聚会及网络社交中更自然流畅地交流。其标签库涵盖多种场景,并支持自定义设置,增强个性化表达。用户可通过订阅服务获取更多高级功能。

Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking 是谷歌发布的一款推理增强型AI模型,具有高达百万tokens的长上下文窗口、可解释的推理过程、代码执行功能及多模态处理能力。它能够有效减少推理矛盾,提升输出结果的可靠性和一致性,广泛适用于教育、科研、内容创作、客户服务以及数据分析等多个领域。

LM Studio

LM Studio是一个开源的本地大语言模型(LLM)应用平台,提供图形用户界面(GUI)和命令行界面(CLI),便于用户使用大型语言模型。LM Studio支持从Hugging Face等平台下载兼容的模型文件,并提供了一种“Playground”模式,用户可以通过该模式同时运行多个AI模型,以增强性能和输出。此外,LM Studio还具备模型发现功能,能够在应用首页展示新的和值得关注的LLMs

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

律己AI

律己AI是一款AI驱动的法务大模型工具,专注于合同审查与风险识别。它通过自动化流程提高法律服务效率,具备合同起草、风险评估及修改建议等核心功能,广泛应用于企业法务、律师服务以及个人用户场景。 ---

Genmoji

Genmoji是一款AI驱动的表情包生成工具,支持文字生成、人脸生成及搜索表情三大功能,通过多样化的内容满足用户的个性化需求。它可与WhatsApp、iMessage等社交应用无缝衔接,增强聊天体验,同时适用于教育、营销等多种场景,兼具实用性和娱乐性。

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。

ZOO

ZOO 是一款 AI 驱动的 CAD 软件平台,主打 Text-to-CAD 功能,可通过文本提示快速生成 3D CAD 模型,降低设计门槛。支持实时编辑、模型 APP 创建、DIFF 查看器及远程 GPU 和 API 接口。适用于工程设计、制造、教育、科研和娱乐等多个领域,提升设计效率与灵活性。

句无忧

句无忧是一款专注于违禁词检测的专业工具,提供违禁词、极限词、敏感词的查询与检测服务,支持自定义词库和行业/平台选择,适用于直播电商、短视频文案、广告文案等领域。它通过AI技术实现快速检测,并支持团队协作管理,助力用户高效创作合规文案。