工具 - 智狐AI导航

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型，能够生成长达10秒的高清视频片段，支持文本到视频、图像到视频的转换，并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情，提供运动画笔、高级相机控制和导演模式等高级控制工具，确保内容的安全性和合规性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 589 浏览

Diffutoon

Diffutoon是一款基于扩散模型的AI框架，旨在将现实风格的视频转换为动漫风格。该框架支持高分辨率视频处理，能够实现风格化、一致性增强、结构引导和自动着色等功能。此外，Diffutoon具备内容编辑功能，用户可通过文本提示调整视频细节，确保视觉效果和内容的一致性。

AI项目与工具 2025年06月12日 45 点赞 0 评论 779 浏览

CriticGPT是一种基于GPT-4架构的人工智能模型，专注于审查和识别由大型语言模型生成的代码中的错误。它利用人类反馈强化学习（RLHF）技术，显著提高了代码审查的准确性和效率。CriticGPT具备代码审核、错误识别、安全漏洞分析、反馈生成、性能评估和辅助学习等功能。它通过记录人类评估员故意插入的错误，生成训练数据，并使用近端策略优化（PPO）算法和强制采样波束搜索（FSBS）技术，生成详细

AI项目与工具 2025年06月12日 76 点赞 0 评论 596 浏览

Gemma 2

Gemma 2是一款由谷歌DeepMind开发的开源人工智能模型，提供90亿和270亿参数版本。它具有卓越的性能、高效的推理速度和广泛的硬件兼容性，适用于各种应用场景。Gemma 2不仅支持多种AI框架，还提供了丰富的资源和工具，以支持开发者和研究人员负责任地构建和部署AI。

AI项目与工具 2025年06月12日 57 点赞 0 评论 841 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 694 浏览

PixVerse V2

PixVerse V2是一款基于Diffusion+Transformer（DiT）架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频，单个片段最长可达8秒，且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频，适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。

AI项目与工具 2025年06月12日 47 点赞 0 评论 1081 浏览

Kimi PPT助手

Kimi PPT助手是一款通过语音或文字指令生成PPT的工具，它提供多种模板，并具备智能排版功能。用户只需简单输入需求，Kimi即可自动生成PPT大纲及内容，节省时间和精力。该工具适用于学生、教师、商务人士以及PPT新手用户，帮助他们快速制作专业且吸引人的演示文稿。

AI项目与工具 2025年06月12日 34 点赞 0 评论 730 浏览

Poe AI新功能「Previews」

Poe AI是一个集成多个强大AI聊天机器人的平台，用户可以通过统一界面与多个AI聊天机器人互动，获得多样化的信息和解决方案。Poe AI的新功能“Previews”允许用户实时预览AI生成的Web应用，支持交互体验，简化编程和设计流程，提高开发效率。该功能支持多种类型的应用程序，包括游戏、文本编辑器、数据分析工具等。用户可以与多个AI聊天机器人进行对话，并且可以无缝切换，获取不同的解决方案或优化

AI项目与工具 2025年06月12日 77 点赞 0 评论 854 浏览

MinerU

MinerU是一款开源智能数据提取工具，专注于复杂PDF文档的高效解析与提取。它能够将包含多种内容类型的PDF文档转换为结构化的Markdown格式，支持图像、公式、表格和文本等多种内容处理，保留原始文档结构和格式，支持公式识别与转换成LaTeX格式，自动删除页眉、页脚、脚注和页码等非内容元素，适用于学术、财务、法律等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 747 浏览

CogVideoX

CogVideoX是由智谱AI开发的开源AI视频生成模型，支持英文提示词生成6秒长、每秒8帧、分辨率为720x480的视频。它具备低显存需求、视频参数定制、3D Causal VAE技术和推理与微调功能。该模型采用基于Transformer的架构和3D Causal Variational Autoencoder技术，支持多阶段训练和自动及人工评估，适用于创意视频制作、教育材料、广告、游戏、电影编

AI项目与工具 2025年06月12日 55 点赞 0 评论 507 浏览

工具

首页

工具

列表

默认

浏览次数

发布日期

Gen