模型

Gemini Diffusion

Gemini Diffusion是谷歌推出的实验性文本扩散模型,通过逐步细化噪声生成文本,具备快速响应、生成更连贯文本和迭代细化等能力。与传统自回归模型不同,它能并行生成文本,提高效率。在外部基准测试中表现优异,速度更快,适用于内容创作、代码生成、数学问题解答和文本编辑等场景。用户需加入等待名单获取访问权限。

CodeArena

CodeArena是一个在线平台,用于实时比较多个大型语言模型(LLM)的代码生成能力。它通过实时渲染和排名机制,帮助开发者评估LLM的性能,包括代码的可读性、效率和准确性。CodeArena集成了开发者工具,支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

DeepFaceLab

DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。

Onit

Onit是一款为Mac设计的AI聊天助手,支持停靠在任何应用程序中。它能通过高亮文本或自动提取当前窗口内容作为上下文,无需复制粘贴。用户可自由切换多种AI模型,如OpenAI、Anthropic等,并支持本地模式以确保数据安全。Onit还提供可定制快捷键、文件上传和代码块支持等功能,适用于代码辅助、内容创作、技术支持等多种场景,提升工作效率和交互体验。

商汤商量SenseChat

商汤商量SenseChat是由商汤科技推出的语言大模型,提供对话和文档理解服务,能够处理百科问答、图片理解、数学解答、代码编写等多种任务。

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型,具备强大的数学推理与代码生成能力。通过预训练与后训练相结合,利用大量高价值语料及强化学习算法,在 7B 参数规模下实现超越更大模型的表现。支持多场景应用,包括教育、科研、软件开发等,已开源至 HuggingFace,便于开发者使用与研究。

LinFusion

LinFusion 是一种创新的图像生成模型,基于线性注意力机制高效处理高分辨率图像生成任务。它在处理大量像素时保持计算复杂度线性增长,显著提高生成效率。LinFusion 支持零样本跨分辨率生成,并与预训练模型组件如 ControlNet 和 IP-Adapter 兼容。在单个 GPU 上,LinFusion 能够生成高达 16K 分辨率的图像,广泛应用于艺术创作、游戏设计、虚拟现实等领域。

LocAgent

LocAgent是一款由多所高校联合开发的代码定位工具,通过构建代码库的图结构并结合大语言模型进行多跳推理,帮助开发者快速找到需修改的代码片段。支持多种开发任务,如错误修复、功能添加和性能优化,具备高效的搜索与定位能力,适用于大规模代码维护场景。

LaWGPT

LaWGPT 是南京大学研发的中文法律大语言模型,基于 LLaMA 进行二次预训练,融合大量法律知识,支持法律咨询、文书生成、司法考试辅助等功能。模型通过法律词表扩展、大规模语料训练及指令微调提升专业性,适用于法律研究、案件分析及政策研究等场景,助力法律行业智能化发展。

AIGC电商解决方案 | @未来力场

生成式 AI 在跨境电商业务流程里能转化为生产力的环节和对应的解决方案有几种分类:按对人力的替换分类,按通用工具分类,按电商场景,按生成对象。