知识库精选- 6 月 19 日
type
status
summary
date
slug
tags
category
password
icon
- 《AI 需要开创性的用户界面和产品: 从苹果说起,深度访谈 Daniel Gross 和 Nat Friedman》本文是一篇深度访谈,探讨了人工智能领域的发展和苹果公司在其中的角色。讨论了人工智能的进步需要创新的用户界面和产品体验,以及人工智能领域的初创公司现状。文章还提到了人类社会在技术发展中常常需要一些看似简单但实际复杂的 “带轮行李箱” 式的创新,以及未来人工智能领域可能的发展趋势。
- 《RAG性能提升策略和评估方法(产品视角)》增加一篇牛大局同学投稿的RAG评估和优化的。社区里缺少这部分内容,如果用专家评估又太废人,这篇文章给了新的启发。
- Meta刚发布六项新东西:https://ai.meta.com/blog/meta-fair-research-new-releases/
- 🦎 Meta Chameleon:结合文本和图像输入输出的模型 7B 和 34B 语言模型;
- 📝 Multi-token Prediction:同时预测多个未来单词,而非逐个预测;
- 🎵 Meta JASCO:生成式文本转音乐模型能够接受各种条件输入,从而实现更高的可控性。论文现已发布,预训练模型即将发布;
- 🔊 AudioSeal:首个专为检测AI生成语音设计的音频水印技术。
- 《视频模型:Hedra》最新发布的模型可以做到口型自然完美匹配。
🔔Xiaohu.AI 日报「6 月 19 日」
✨✨✨✨✨✨✨✨
1️⃣
🔬Meta AI 公布了多项新的研究成果
- 内容:包括4个可用的新的AI模型和2个额外的研究成果 🔗 详细内容:https://xiaohu.ai/p/9966 🔗 https://x.com/imxiaohu/status/1803252073406013742
2️⃣
🎤Hedra:上传人物照片+任意语音,可实现人物唱歌、说话
- 功能:根据任意人物照片和语音内容生成个人会说话和唱歌的动态视频
- 特点:保持唇形和表情、姿态与语音内容相匹配 🔗 https://x.com/imxiaohu/status/1803264143698567319
3️⃣
📚OpenAI、斯坦福、微软、普林斯顿大学等多所机构发布大模型《提示技术报告》
- 内容:筛选出1565篇论文,整理标准术语和提示方法,创建易于理解和使用的目录 🔗 报告简介:https://trigaten.github.io/Prompt_Survey_Site/ 🔗 报告全文:https://arxiv.org/pdf/2406.06608 🔗 报告解读:http://xiaohu.ai/p/9999 🔗 https://x.com/imxiaohu/status/1803372968078352800
4️⃣
📊首个 AI 高考评测结果发布
- 结果:GPT-4o 名列第二
- 测试:上海人工智能实验室使用司南评测体系OpenCompass,选取6个开源模型及GPT-4o,进行高考“语数外”全卷能力测试
- 细节:评测采用“语数外”三科题目作为测试集,仅输入文字题干(数学包含2道带图试题),不纳入英语听力部分(30分) 🔗 详细内容:https://xiaohu.ai/p/10022 🔗 https://x.com/imxiaohu/status/1803384885144592438
5️⃣
🔍GPT-4o 最新演示
- 泄露代码显示:chatgpt-included-in-voice-alpha 似乎已经准备部署
- 预计:两周内可进行灰度测试🥲 🔗 https://x.com/imxiaohu/status/1803397574155706783