Transfusion Transfusion是由Meta公司开发的多模态AI模型,能够同时生成文本和图像,并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型,在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据,表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成 AI项目与工具 2025年06月12日 26 点赞 0 评论 471 浏览
ChildMandarin ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集,包含41.25小时高质量语音,覆盖全国22个省市。数据通过家长引导式对话采集,保证自然真实。该数据集支持语音识别、说话人验证和语言研究,适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域,为儿童语音技术研究提供重要资源。 AI项目与工具 2025年06月12日 28 点赞 0 评论 470 浏览
触手AI 触手AI集成了市面上主流绘图软件的完整功能,包括文生图、图生图、ControlNet控图、姿势生图、高清修复、智能修图、模型训练等一系列实用功能。触手AI无需科学上网。 Ai绘画生成 2025年06月05日 44 点赞 0 评论 470 浏览
ChainGPT ChainGPT是一个基于区块链的人工智能模型,旨在帮助个人和企业完成所有加密和区块链相关的任务。它使用变压器网络等深度学习技术来生成类似人类的文本,并回答有关加密和区块链的... 财经投资 1970年01月01日 0 点赞 0 评论 470 浏览
AI开搭 AI开搭是专业AI机器人应用搭建发布平台,支持大模型LLM切换/知识库/插件/工作流配置,一键发布到自己的网站/飞书/微信/钉钉群等场景,任何个人/企业/开发者都无需编程通过开搭创建... 创作工具 1970年01月01日 0 点赞 0 评论 470 浏览
Arcads AI 一款人工智能驱动的工具,可将文本转换为高质量、引起情感共鸣的视频广告。Arcads AI使用先进的人工智能算法来生成真实、逼真的视频。 Ai视频生成 2025年06月05日 48 点赞 0 评论 470 浏览
百聆 百聆是一款开源语音对话系统,融合语音识别、语音活动检测、大语言模型和语音合成技术,实现自然流畅的语音交互。支持低延迟运行,无需GPU,适用于边缘设备。具备记忆、工具调用和任务管理等功能,适用于智能家居、个人助理、车载系统等多种场景,提供高效的语音交互解决方案。 AI项目与工具 2025年06月12日 90 点赞 0 评论 470 浏览
GLM GLM-4-Flash是一款由智谱AI开发的免费大模型API,具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术,尤其是Transformer架构,来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域,为用户提供了一个全面而高效的AI解决方案。 AI项目与工具 2025年06月12日 34 点赞 0 评论 470 浏览
Copilot2trip Copilot2trip,只需输入您的出发点和目的地,copilot2trip 就会绘制出一条优化的路线,通过使用交互式地图为你创建量身定制的个性化旅行计划。 生活创意 2025年06月05日 38 点赞 0 评论 470 浏览
Brave Search 一款注重隐私的搜索引擎,由Brave Software开发。是世界上最完整、最独立、最私密的搜索引擎。 Brave Search以独立索引为基础,提供无痕搜索体验,不会跟踪用户的查询或点击行为。 AI搜索问答 2025年06月05日 99 点赞 0 评论 470 浏览