AI项目与工具

Follow

Follow-Your-Click是一款由腾讯、清华大学和香港科技大学合作开发的图像到视频生成模型。它允许用户通过简单的点击和动作提示将静态图像转化为包含局部动画效果的动态视频。主要功能包括直观的用户界面、局部动画生成、多对象处理、简短动作提示、高质量视频生成及运动速度控制。其工作原理涉及用户交互、图像分割、第一帧遮罩策略、运动增强模块和基于光流的运动幅度控制。

Star

Star-3 Alpha是一款基于F.1架构的图像生成大模型,擅长处理复杂提示词,生成高质量、真实感强的图像。具备出色的美学捕捉能力和丰富的参数调节选项,适用于艺术创作、广告设计、电商展示等多种场景,极大提升了相关行业的设计效率与成果质量。

clay

Clay是一款以AI为核心驱动的营销平台,通过整合海量数据提供商和自动化研究功能,帮助企业优化市场研究、潜在客户开发、个性化营销及销售外联等流程。其核心功能包括数据丰富化、AI辅助研究、个性化外联内容生成以及与CRM和邮件工具的深度集成。Clay显著提高了客户触达的效果,响应率可提升至原来的2-3倍。

Moondream

Moondream是一款小型的开源人工智能视觉语言模型,具有强大的图像处理能力和灵活性,能够在不同设备上运行。它基于Apache 2.0许可证,支持商业使用,并广泛应用于安全监控、无人机和机器人技术以及零售与购物领域。

MealPlanner

MealPlanner 是一款基于 AI 的个性化餐饮规划工具,可根据用户饮食偏好、过敏情况和特殊需求生成定制化食谱和购物清单。用户可通过聊天方式与 AI 助手互动,获取详细烹饪指导,优化家庭餐饮管理,提升健康水平并节省时间和开支。

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型,具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色,适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理,旨在提供高质量的语音交互体验。

MetaStone

MetaStone-L1-7B 是一款轻量级推理模型,具备强大的数学和代码推理能力,性能达到行业领先水平。基于 DeepSeek-R1-Distill-Qwen-7B 架构,采用 GRPO 训练方式,支持多种计算架构并具备高效的云原生部署能力。适用于数学解题、编程辅助、智能客服、内容创作等多个场景,具有广泛的应用价值。

Smartcat

Smartcat 是一款先进的AI翻译平台,提供自动化的翻译服务和本地化解决方案。它集成了AI翻译、计算机辅助翻译(CAT)工具及翻译管理系统(TMS),支持超过280种语言和50多种文件格式。Smartcat通过内置市场连接全球翻译专家和客户,提供高效、准确的翻译服务。此外,该平台还配备了项目管理和自动化工作流工具,帮助企业简化翻译流程,加快内容的全球化进程。

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具,能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤,无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南,并支持多种应用场景,包括教育、新闻、企业培训和有声书制作等。

ILLUME

ILLUME是一款基于大型语言模型的统一多模态大模型,集成了视觉理解与生成能力,采用“连续图像输入 + 离散图像输出”架构,通过语义视觉分词器和三阶段训练流程,实现了高效的数据利用和多模态任务处理能力。模型能够无缝整合视觉理解与生成功能,广泛应用于视频分析、医疗诊断、自动驾驶及艺术创作等领域。