创作 - 智狐AI导航

EVI 3

EVI 3是Hume AI推出的全新语音语言模型，能够同时处理文本和语音标记，实现自然、富有表现力的语音交互。它支持高度个性化，根据用户提示生成任何声音和个性，并实时调节情感和说话风格。在与GPT-4o等模型的对比中，EVI 3在情感理解、表现力、自然度和响应速度等方面表现更优，具备低延迟响应能力，可在300毫秒内生成语音回答。EVI 3适用于智能客服、语音助手、教育辅导、情感支持和内容创作等多个

AI项目与工具 2025年06月11日 45 点赞 0 评论 772 浏览

Keevx

Keevx是一款专注于AI数字人视频创作的工具，主要面向海外中小企业和个人创作者。它提供AI智能脚本生成、翻译功能，搭配优质公共人像和模板，支持一键生成营销视频。用户可上传自有脚本，选择数字人形象和语音来制作视频，适用于电商产品展示、员工培训、社交媒体内容创作及品牌宣传等场景。

AI项目与工具 2025年06月11日 97 点赞 0 评论 847 浏览

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音（TTS）模型，基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练。它支持零样本语音克隆，仅需5秒参考音频即可生成高度逼真的个性化语音，并具备情感夸张控制功能，可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用于交互式应用。此外，它采用安全水印技术防止滥用，适用于内容

AI项目与工具 2025年06月11日 55 点赞 0 评论 517 浏览

小云雀

小云雀是剪映推出的智能创作Agent，基于AI技术提供视频、数字人口播视频、设计图和图片换背景等功能。用户只需输入指令，即可高效完成内容创作。核心功能包括智能成片、数字人视频、AI设计和AI换背景，界面简洁易用，操作便捷高效。依托字节跳动的云雀大模型，融合深度学习与多模态技术，具备强大的图像生成与视频编辑能力，适用于短视频创作、数字人口播、设计广告、社交媒体内容及教育培训等场景。

AI项目与工具 2025年06月11日 33 点赞 0 评论 1830 浏览

OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型，旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略，将风格学习与一致性学习解耦，并支持与任意风格的 LoRA 模块集成，实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性，具备更高的灵活性和泛化能力，在实验中表现出与 GPT-4o 相当的性能。

AI项目与工具 2025年06月11日 40 点赞 0 评论 775 浏览

Style Art AI

Style Art AI 是一款基于 AI 技术的图像创作工具，结合 ChatGPT 4o 模型与多种艺术风格，可将文字描述或图片快速转换为不同风格的艺术作品。用户只需输入文本或上传图片，设置参数即可生成高质量图像。支持 30 多种风格，包括经典动画、迪士尼、皮克斯等，并提供风格混合、细节优化等功能，适合初学者和专业设计师使用。

AI项目与工具 2025年06月11日 16 点赞 0 评论 637 浏览

AIpai

AIpai是一款AI视频创作Agent工具，支持用户快速生成专业视频内容。其主要功能包括智能编剧、角色设计、场景构建、图像生成、视频生成、声音设置和参数调整。用户只需输入文案，AIpai即可自动生成分镜、图像和视频选项，并支持多种风格和参数定制。适用于短视频制作、品牌宣传、个人创作、教育领域和影视制作等多种场景，大幅提升创作效率，降低制作门槛。

AI项目与工具 2025年06月11日 45 点赞 0 评论 536 浏览

Opera Neon

Opera Neon是Opera推出的AI Agent浏览器，基于智能Agent技术重新定义浏览器功能。它支持浏览网页、与用户合作完成任务，如研究主题、自动化工作流程和创建内容。核心功能包括聊天、执行任务和创作内容。用户可通过官网加入等待名单，目前处于邀请制。Opera Neon提供多种应用场景，如旅行规划、金融分析、内容创作、教育研究和任务自动化。其功能涵盖即时答案、研究、内容生成、导航网页完成

AI项目与工具 2025年06月11日 83 点赞 0 评论 834 浏览

Onit

Onit是一款为Mac设计的AI聊天助手，支持停靠在任何应用程序中。它能通过高亮文本或自动提取当前窗口内容作为上下文，无需复制粘贴。用户可自由切换多种AI模型，如OpenAI、Anthropic等，并支持本地模式以确保数据安全。Onit还提供可定制快捷键、文件上传和代码块支持等功能，适用于代码辅助、内容创作、技术支持等多种场景，提升工作效率和交互体验。

AI项目与工具 2025年06月11日 14 点赞 0 评论 821 浏览

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型，基于MoE架构，支持文本、图像、音频和视频等多种模态的输入输出，具备强大的理解和生成能力。模型在多个任务中表现优异，如图像识别、视频理解、语音问答等，适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性，为用户提供一体化智能体验。

AI项目与工具 2025年06月11日 79 点赞 0 评论 527 浏览

创作

首页

创作

列表

默认

浏览次数

发布日期