Emotion Emotion-LLaMA是一款基于多模态输入的情绪识别与推理模型,结合音频、视觉和文本信息,提升情感理解的准确性与可解释性。模型采用改进版LLaMA架构,通过指令调整增强情感处理能力,并依托自建的MERR数据集进行训练与验证。在多个挑战赛中表现优异,适用于人机交互、教育、心理健康、客户服务等领域,具有广泛的应用前景。 AI项目与工具 2025年06月12日 85 点赞 0 评论 606 浏览
FaceLift FaceLift是一种由Adobe与加州大学默塞德分校联合开发的AI工具,能够从单张人脸图像中重建出高精度的3D头部模型。其核心技术包括多视图扩散模型和GS-LRM重建器,支持多视角一致性、身份保持和4D新视图合成,适用于虚拟现实、数字娱乐、远程交互等多个领域。该工具具备强大的几何与纹理细节表现能力,且可与2D面部重动画技术集成,广泛应用于内容创作与科研场景。 AI项目与工具 2025年06月12日 74 点赞 0 评论 606 浏览
ChatNio 一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案 Ai开源项目 2025年06月05日 56 点赞 0 评论 604 浏览
OpenCity OpenCity是一个由香港大学联合华南理工大学和百度共同研发的交通预测模型。该模型采用了Transformer架构和图神经网络,通过大规模预训练学习交通数据中的时空依赖关系,具有卓越的零样本预测能力和快速情境适应能力。OpenCity能够有效处理不同空间区域和时间的城市交通模式,并具备良好的可扩展性。其应用场景包括交通流量预测、交通拥堵分析、公共交通优化以及智能交通信号控制等。 AI项目与工具 2025年06月12日 32 点赞 0 评论 604 浏览
Sparkify Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识点。其多模态处理能力结合Google Search数据,确保内容准确且与最新信息同步。适用于教育、科普和企业培训等领域,提升理解效率和传播效果。目前处于内测阶段,可通过官网加入等候列表。 AI项目与工具 2025年06月11日 24 点赞 0 评论 603 浏览
DaFont 一个广受欢迎提供大量免费可下载的字体网站。用户可以通过字母顺序、风格、作者或流行度浏览字体,网站上目前有超过 87,000 种字体可供选择,包括带有重音符号和欧元符号的字体。 字体字库 2025年06月05日 75 点赞 0 评论 603 浏览
Flixier 一款强大的在线视频编辑工具,提供视频翻译功能。用户可以通过Flixier将视频翻译成超过130种语言,并添加字幕和配音。 视频剪辑 2025年06月05日 58 点赞 0 评论 603 浏览
TeraBox 一款云存储服务,能提供最多1TB的免费云存储及在线文件传输功能,还融合了AI PPT制作、AI论文写作及智能改写等AI内容生成功能。 网盘传输 2025年06月05日 86 点赞 0 评论 603 浏览
DINO DINO-X是一款由IDEA研究院开发的通用视觉大模型,具备开放世界对象检测与理解的能力。它支持多种提示类型,无需用户额外输入即可识别图像中的任意对象,并在多个基准测试中刷新了性能记录。DINO-X拥有Pro和Edge两个版本,分别针对高性能需求和边缘设备优化。其应用范围涵盖自动驾驶、智能安防、工业检测及机器人视觉等领域,助力行业创新与发展。 AI项目与工具 2025年06月12日 91 点赞 0 评论 602 浏览
MyReport 一种自动化报告工具,通过自动化数据收集和引用,可帮助您根据数据创建和共享报表。MyReport由专门从事人工智能和数据分析的公司 alaba ai 提供支持。 数据分析 2025年06月05日 16 点赞 0 评论 602 浏览