AI

CAR

CAR(Certainty-based Adaptive Reasoning)是字节跳动联合复旦大学推出的自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)的推理效率与准确性。该框架通过动态切换短答案和长形式推理,根据模型对答案的置信度(PPL)决定是否进行详细推理,从而在保证准确性的同时节省计算资源。CAR适用于视觉问答(VQA)、关键信息提取(KIE)等任务,在数学

WonderPlay

WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架,能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术,支持多种物理材质和动作类型,实现逼真的动态效果。用户可通过简单操作与场景互动,生成丰富的物理响应。该工具具备交互式查看器,适用于AR/VR、影视特效、教育、游戏开发等多个领域。

SOM AI

SOM AI 是一款 AI 辅助学术写作工具,帮助学生完成毕业论文和学术研究。它提供研究主题头脑风暴、段落释义、简化复杂内容等功能,帮助学生避免抄袭并快速理解学术内容。SOM AI 还能提供情感支持,缓解写作压力,适用于毕业论文和日常学术作业,是高效的学习助手。

PxBee

PxBee是一款在线AI图片编辑平台,基于先进的人工智能技术,帮助用户快速移除图片背景、增强图片质量以及生成新的背景。用户只需上传图片,PxBee的AI工具能自动识别并移除背景,在复杂的图像上也能保持边缘的精确性。平台提供一键式的图片增强功能,能修复模糊的照片、减少噪点、改善光照并提升分辨率。此外,PxBee还支持背景替换、场景生成和透明背景应用,适用于创意设计、社交媒体内容创作、品牌展示和旅行摄

幻舟AI

幻舟AI是一站式AI短片创作平台,支持批量生成广告片、宣传片、动画片等。基于Midjourney、Runway等全球领先的AI模型,提供剧本创作、角色设计、分镜生成及视频制作的全流程服务。平台支持多种模型切换,满足不同风格和场景需求,简化操作流程,提升创作效率,是影视创作者的有力工具。

Jodi

Jodi是由中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架,基于联合建模图像域和多个标签域,实现视觉生成与理解的统一。它支持联合生成、可控生成和图像感知三种任务,利用线性扩散Transformer和角色切换机制,提升生成效率和跨领域一致性。Jodi使用Joint-1.6M数据集进行训练,包含20万张高质量图像和7个视觉域标签,适用于创意内容生成、多模态数据增强、图像编辑与修复等场景。

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段,生成高度可控且逼真的动画,保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异,适用于虚拟现实、游戏、人机交互等多个领域。

稿定AI社区

稿定AI社区是一个在线AI创意灵感平台,提供丰富的设计资源和工具,涵盖形象照、电商设计、节日主题、3D插画等多个领域。用户可通过上传图片,利用AI生图功能快速生成类似风格的创意图像,提升设计效率。平台界面简洁,分类清晰,支持灵感浏览、创作、分享与个性化定制,适用于设计师、电商运营者及普通用户,是激发创意和提升设计能力的优质平台。

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。

SelectYet

SelectYet是一款基于AI技术和“记忆摘要”技术的文献分析工具,能够对海量文献进行结构化分析,快速提取关键信息并生成文献综述。用户可输入研究主题、上传PDF文献,并设置自定义分析选项,工具支持结果导出为Excel格式。它适用于高效学习、数据编码、行业研究、批改代工、市场调研和政策分析等场景,接入了deepseek-R1/V3模型,未来将融合更多模型提升分析效率与准确性。