AI项目与工具

VibeNecto

VibeNecto是一款AI营销视觉素材生成平台,能够根据用户输入的文本描述快速生成高质量的定制化图片,适用于社交媒体、广告等多种营销场景。用户无需专业设计技能,可在几秒钟内获得符合品牌风格的视觉素材。平台提供多种视觉风格选择,具备背景移除功能,可自动去除图片背景,适合产品照片和专业头像处理。所有生成的图片都会被安全地存储在云端,自动保存历史记录,方便用户随时访问、下载或重复使用。

AdCreative.ai

AdCreative.ai是一款基于人工智能技术的广告创意生成工具,能够自动生产高质量的广告文案、图片、视频等内容,支持多平台投放,包括Facebook、Google、LinkedIn等。其主要功能涵盖广告创意生成、品牌资料管理、竞争对手广告分析及批量素材制作,旨在帮助企业优化广告策略并提升广告表现。

Call Annie

Call Annie是一款基于AI技术的对话工具,通过视频通话形式提供虚拟AI助手Annie,支持实时交流和多种应用场景。主要功能包括实时视频通话、自然语言处理、个性化协助和多平台访问,适用于语言学习、情感陪伴、信息查询、旅行规划、教育辅导及职业发展等场景。

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理,能够通过稀疏控制信号(如手动轨迹、面部关键点序列或音频)实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习,能够将多种控制信号组合使用,生成复杂的动画效果,并能生成较长的视频片段。 ---

POINTS 1.5

POINTS 1.5 是腾讯微信开发的多模态大模型,基于LLaVA架构设计,包含视觉编码器、投影器和大型语言模型。它在复杂场景OCR、推理、关键信息提取、数学问题解析及图片翻译等方面表现突出,适用于票据识别、自动客服、新闻摘要、学术论文处理、旅游翻译和在线教育等多个领域。该模型通过高效的数据处理和特征融合技术,实现了跨模态任务的精准处理与高效输出。

StereoCrafter

StereoCrafter是一款由腾讯AI Lab与ARC Lab联合开发的创新性工具,可将传统2D视频转化为高质量的立体3D视频。它采用深度估计、视频变形及立体视频修复等关键技术,确保生成的3D视频具备高保真度和一致性。该工具广泛应用于影视制作、虚拟现实(VR)、增强现实(AR)、游戏开发等领域,为用户提供更加沉浸式的视觉体验。

悬河

悬河是一款基于AI技术的虚拟角色社交平台,支持用户通过文字或语音与定制化的AI角色进行深度交流。其核心功能包括情感陪伴、IP互动、个性化角色定制、智能推荐和沉浸式聊天体验,广泛应用于情感支持、社交训练、心理辅导、生活助手及学习辅助等领域。

DRT

DRT-o1是一套由腾讯研究院开发的基于长链思考推理(CoT)技术的AI翻译模型,专门针对文学作品翻译设计,尤其擅长处理比喻和隐喻等复杂修辞手法。模型通过多智能体框架和迭代优化机制,显著提升了翻译质量和效率,同时具备强大的复杂语言结构处理能力。DRT-o1已在多个应用场景中展现出广泛潜力,包括文学翻译、跨文化交流、教育辅助以及多语言内容创作等领域。

Docling

Docling 是一款开源工具,支持多种文档格式的解析与转换,包括 PDF、DOCX、PPTX、图片和 HTML。它通过高级 PDF 理解和 OCR 技术,将文档内容转换为统一的结构化格式(如 Markdown 和 JSON)。Docling 可与 LlamaIndex 和 LangChain 集成,增强文档的检索和问答能力,并提供简洁的命令行界面,适用于自动化文档处理、数据科学、知识管理和信息检

DMind

DMind是由DMind研究机构开发的专为Web3领域优化的大型语言模型,针对区块链、去中心化金融和智能合约等场景深度优化。采用RLHF技术对齐,性能在Web3专项测试中表现优异,推理成本仅为大模型的十分之一。提供DMind-1和DMind-1-mini两个版本,适用于复杂任务和轻量级部署。支持智能合约生成与验证、DeFi交易代理部署、多轮对话交互等功能,基于Transformer架构,结合专业数