AI项目与工具

MedReason

MedReason是由多所高校联合开发的医学推理框架,通过知识图谱增强大型语言模型在医学领域的推理能力。其核心功能包括生成高质量推理数据、提升模型性能、确保医学准确性,并支持多种医学任务。MedReason采用医学实体提取、路径搜索、链式推理生成和质量过滤等技术,有效提升模型在复杂临床场景中的表现。项目提供开源代码、模型和论文,适用于医学问答、辅助诊断、教育培训及研究等领域。

MyMemo

MyMemo是一款基于AI技术的智能工具,主要功能包括文件转换、一站式数字空间管理、AI聊天功能、全球标准合规以及安全存储。它能够将用户上传的各种文件(如TXT、PDF、Word文档)转化为精炼的报告和文章,并提供统一的平台来整理和管理数字内容。此外,MyMemo还通过AI聊天功能帮助用户轻松访问和检索数据,并严格遵守国际数据保护法规以确保用户数据的安全。适用于研究人员、学者、作家、内容创作者、企

CreatorKit

CreatorKit是一款基于AI技术的视觉内容创作工具,支持图片、视频及广告的智能生成与编辑。其核心功能包括AI图像生成、视频制作、品牌定制、多平台适配等,适用于电商、社交媒体及广告行业。用户可通过简单指令完成内容创作,提升效率并优化视觉呈现。提供多种订阅方案,满足不同规模企业的需求。

Mureka V6

Mureka V6是昆仑万维推出的AI音乐创作平台基座模型,支持多语言音乐生成及纯音乐创作。采用自研ICL技术,提升音乐结构连贯性与情感表达。用户可通过文本、音频或音色参考进行个性化创作,适用于多种音乐风格与情绪。支持从简单模式到高级模式的灵活操作,广泛应用于音乐爱好者、专业音乐人及内容创作等领域。

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型,采用量化感知训练技术,在降低显存需求的同时保持高性能。它支持多模态任务,具备 128,000-token 长上下文处理能力,并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景,同时兼容多种推理框架,便于部署。

Eleven v3

Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。

DUSt3R

DUSt3R是一个由芬兰阿尔托大学和Naver欧洲实验室联合研发的3D重建框架。该框架能够快速地从任意图像集合中重建出三维场景,无需事先了解相机校准或视点位置信息。DUSt3R主要功能包括快速3D重建、无需相机校准、多视图立体重建、单目和双目重建以及生成深度图、置信度图和点云图。它采用了点图表示法、Transformer网络架构和端到端训练方式,并提出了全局对齐策略来处理多视图重建任务。

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架,通过与高级模型API交互获取数据对,结合预训练的视觉语言模型(VLMs)动态优化训练集,大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练,显著提升了生成图像的质量和多样性,广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

StereoCrafter

StereoCrafter是一款由腾讯AI Lab与ARC Lab联合开发的创新性工具,可将传统2D视频转化为高质量的立体3D视频。它采用深度估计、视频变形及立体视频修复等关键技术,确保生成的3D视频具备高保真度和一致性。该工具广泛应用于影视制作、虚拟现实(VR)、增强现实(AR)、游戏开发等领域,为用户提供更加沉浸式的视觉体验。

SOM AI

SOM AI 是一款 AI 辅助学术写作工具,帮助学生完成毕业论文和学术研究。它提供研究主题头脑风暴、段落释义、简化复杂内容等功能,帮助学生避免抄袭并快速理解学术内容。SOM AI 还能提供情感支持,缓解写作压力,适用于毕业论文和日常学术作业,是高效的学习助手。