OmniSVG OmniSVG是复旦大学与StepFun联合开发的全球首个端到端多模态SVG生成模型,基于预训练视觉语言模型,通过创新的SVG标记化技术实现结构与细节的解耦,支持从文本、图像或角色参考生成高质量矢量图形。其训练效率高,支持长序列处理,适用于图标设计、网页开发、游戏角色生成等场景,生成结果具备高度可编辑性和跨平台兼容性。 AI项目与工具 2025年06月12日 90 点赞 0 评论 532 浏览
HUGWBC HUGWBC是由上海交通大学与上海AI Lab联合开发的人形机器人全身控制器,支持多种自然步态和精细参数调整,具备高鲁棒性和实时外部干预能力。基于强化学习和不对称训练框架,实现从模拟到现实的高效迁移,适用于复杂地形导航、动态任务执行及人机协作等多种场景。 AI项目与工具 2025年06月12日 34 点赞 0 评论 532 浏览
Smartcat Smartcat 是一款先进的AI翻译平台,提供自动化的翻译服务和本地化解决方案。它集成了AI翻译、计算机辅助翻译(CAT)工具及翻译管理系统(TMS),支持超过280种语言和50多种文件格式。Smartcat通过内置市场连接全球翻译专家和客户,提供高效、准确的翻译服务。此外,该平台还配备了项目管理和自动化工作流工具,帮助企业简化翻译流程,加快内容的全球化进程。 AI项目与工具 2025年06月12日 60 点赞 0 评论 532 浏览
Heygem Heygem是一款由硅基智能推出的开源数字人模型,支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音,30秒内完成克隆,60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势,适用于内容创作、教育、直播、影视及客服等多个领域,提供高效、低成本的数字人解决方案。 AI项目与工具 2025年06月12日 18 点赞 0 评论 532 浏览
TabTac TabTac是一款基于AI技术的浏览器,集成了搜索增强、网页浏览优化和办公辅助功能。它支持滑词搜索、图像识别、AI摘要、邮件撰写、语音控制等实用工具,提升信息处理效率。同时具备隐私保护机制,适用于商务、学术及日常多任务场景。 AI项目与工具 2025年06月12日 22 点赞 0 评论 532 浏览
LOKI LOKI是一个由中山大学与上海AI实验室联合推出的合成数据检测基准,用于评估大型多模态模型在识别视频、图像、3D模型、文本及音频等多模态合成数据方面的性能。它包含超过18,000个问题,涵盖26个子类别,支持多层次标注和细粒度异常注释,并通过自然语言解释增强模型的可解释性。LOKI还通过对比多种开源和闭源模型的表现,揭示了这些模型在合成数据检测任务中的优势与不足。 AI项目与工具 2025年06月12日 50 点赞 0 评论 532 浏览
书生·浦像 书生·浦像是由多家科研机构联合开发的超高动态成像算法,核心为浦像HDR(UltraFusion HDR)。它结合AIGC与HDR技术,在极端光照条件下实现图像细节修复和高质量输出,有效解决动态场景中的运动伪影问题。适用于摄影、手机成像和自动驾驶等领域,具有多曝光融合、动态处理、色调映射等功能,提升了图像的鲁棒性与真实感。 AI项目与工具 2025年06月12日 56 点赞 0 评论 532 浏览
SCoRe SCoRe是一种由谷歌DeepMind提出的基于强化学习的多轮训练方法,旨在提高大型语言模型的自我纠错能力。它通过模型自动生成的数据进行训练,并采用正则化约束与奖励机制,有效提升了模型在数学、编程等任务中的准确性。此外,SCoRe能够适应训练与推理过程中的数据分布差异,展现出较强的灵活性与实用性。 AI项目与工具 2025年06月12日 42 点赞 0 评论 532 浏览
Mind GPT Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型,集成了语音、视觉与语言理解技术,具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息,还能提供个性化服务,如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解,该模型实现了从感知到表达的智能化跨越,为用户提供全面的支持。 AI项目与工具 2025年06月12日 65 点赞 0 评论 532 浏览
靠岸学术 Scholaread是一款专注于学术研究的多功能工具,集成了PDF阅读、学术翻译、文献管理和笔记功能。其主要特点包括支持多平台同步、一键同步Zotero论文库、重排模式优化阅读体验、逐段对照翻译支持多语言、图片及表格放大查看、引文添加至阅读列表、目录跳转以及高亮笔记标注。适用于学术研究、文献综述、跨语言研究、移动学习及团队协作等多种场景。 AI项目与工具 2025年06月12日 18 点赞 0 评论 531 浏览