AI项目与工具

OmniSVG

OmniSVG是复旦大学与StepFun联合开发的全球首个端到端多模态SVG生成模型,基于预训练视觉语言模型,通过创新的SVG标记化技术实现结构与细节的解耦,支持从文本、图像或角色参考生成高质量矢量图形。其训练效率高,支持长序列处理,适用于图标设计、网页开发、游戏角色生成等场景,生成结果具备高度可编辑性和跨平台兼容性。

OpenELM

OpenELM是苹果公司推出的一系列高效开源语言模型,涵盖从2.7亿到30亿参数规模的不同版本。该模型基于Transformer架构,采用层间缩放策略优化参数分配,使用分组查询注意力(GQA)和SwiGLU激活函数等技术。OpenELM在公共数据集上预训练,并在多项自然语言处理任务中展现出色性能。模型代码和预训练权重已公开,旨在促进开放研究和社区发展。

Nephola

Nephola 是一款专注情绪管理和心理健康的 AI 应用,通过四个性格各异的 AI 智能体提供情感陪伴。用户可选择不同角色进行互动,获得个性化支持。应用包含心情日志、自我探索、正念冥想及休闲游戏等功能,帮助用户记录情绪、探索性格并缓解压力。适用于日常情绪管理与心理健康提升。

REimagineHome

REimagineHome是一款基于人工智能的室内设计平台,通过上传照片和输入偏好,快速生成定制化设计方案。其功能包括虚拟布景、空间清理、园林美化、家具摆放及外部结构渲染,适用于房地产营销、室内设计、装修规划等多个领域,显著提升设计效率并降低相关成本。

Kuse AI

Kuse AI 是一款基于AI技术的智能工具,提供无边界的画布,支持多种格式内容的自由组织和呈现。其AI智能助手可自动总结、生成内容并提供建议,提升工作效率。支持实时协作,适合团队头脑风暴和创意发想,同时具备多媒体整合、透明引用与信息验证、定制化工作流等功能,适用于项目管理、创意发想、学术研究、教育学习和市场营销等场景。

MealPlanner

MealPlanner 是一款基于 AI 的个性化餐饮规划工具,可根据用户饮食偏好、过敏情况和特殊需求生成定制化食谱和购物清单。用户可通过聊天方式与 AI 助手互动,获取详细烹饪指导,优化家庭餐饮管理,提升健康水平并节省时间和开支。

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型,具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色,适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理,旨在提供高质量的语音交互体验。

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具,能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤,无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南,并支持多种应用场景,包括教育、新闻、企业培训和有声书制作等。

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具,具备文本到视频生成、图像到视频转换等功能,支持高清视频输出及音效匹配。它通过三维变分自编码器(3D VAE)、Transformer架构等技术手段,提升了视频生成的质量与效率,适用于内容创作、广告营销、教育培训等多个领域。

Woxo

Woxo是一款基于人工智能的视频生成工具,专为社交媒体内容创作者设计。它通过AI技术将文本或概念转化为高质量视频,提供内容创意、快速编辑及定时发布等功能,支持多种社交媒体平台,显著提升视频制作效率。其多平台兼容性和批量创作能力使其成为高效内容生产的理想选择。