AI项目与工具

creatify

Creatify是一款由人工智能驱动的视频广告制作平台,支持根据产品信息自动生成高质量营销视频。其主要功能包括自动视频生成、AI脚本创作、多样化模板选择、动态特效设计及多语言支持。Creatify适用于电商、品牌推广、教育培训等多种场景,帮助用户高效制作专业视频广告,降低时间和成本投入。

DAM

DAM-3B是英伟达开发的多模态大语言模型,专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域,生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络,有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理,适用于动态场景。模型基于Transformer架构,支持多模态输入,广泛应用于内容创作、智能交互及无障碍工具等领域。

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具,可将视频中的唇部动作转换为文字,支持多语言和口音识别。其高精度算法确保了文字输出的准确性,适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便,处理高效,注重用户数据隐私保护,适合专业用户和普通用户使用。

Llama Tutor

Llama Tutor 是一款基于 AI 的开源个性化学习平台,利用 Llama 3.1 和 Together AI 技术生成定制化学习计划,涵盖多学科领域,提供互动式学习体验和精准解答。支持个人学习、学术教育、职业发展和语言学习等应用场景,致力于打造高效、有趣的沉浸式学习环境。

AgentCPM

AgentCPM-GUI是由清华大学与面壁智能团队联合开发的开源端侧GUI代理系统,专为中文应用场景优化。基于MiniCPM-V模型,支持通过截图输入并自主执行用户指令,具备高精度GUI元素识别与OCR能力。采用强化微调和紧凑动作空间设计,提升任务执行效率与移动端适配性。适用于智能助手、自动化测试、老年人辅助及企业应用等领域。

Raphael

Raphael 是一款基于 Flux.1-Dev 模型的 AI 图像生成工具,无需注册即可使用。支持多种艺术风格,提供高质量图像生成,具备快速处理能力和严格的隐私保护机制。适用于艺术创作、内容设计、营销、游戏开发等多个领域,适合个人及商业用途。

Ditto

Ditto是一款基于Flask框架的Web应用程序生成工具,通过自然语言输入和大型语言模型(LLM)实现自动化代码生成,支持模块化结构和无代码操作,适合快速原型开发、教育学习及非技术人员使用。其核心功能包括自然语言解析、代码自动生成、模块化管理以及环境变量配置等。

Poe AI新功能「Previews」

Poe AI是一个集成多个强大AI聊天机器人的平台,用户可以通过统一界面与多个AI聊天机器人互动,获得多样化的信息和解决方案。Poe AI的新功能“Previews”允许用户实时预览AI生成的Web应用,支持交互体验,简化编程和设计流程,提高开发效率。该功能支持多种类型的应用程序,包括游戏、文本编辑器、数据分析工具等。用户可以与多个AI聊天机器人进行对话,并且可以无缝切换,获取不同的解决方案或优化

COVE

COVE是一款以AI驱动的协作工具,提供共享工作空间和实时编辑功能,支持用户与AI共同思考和工作。它能从用户的文本、表格、图像等内容中学习,提供个性化建议和多样化思路,同时无缝集成于常用工具,适用于项目管理、研究分析、内容创作、教育学习及会议记录等多个场景。

从容大模型

从容大模型是云从科技推出的多模态AI模型,在国际评测中表现优异,具备视觉语言理解与推理能力。其核心技术包括多模态对齐、高效工程优化和原生多模态推理,支持复杂场景下的文本识别和开放域问答。该模型在医学健康、金融、制造、政务等多个领域实现规模化应用,助力智能化转型。