知识库精选- 6 月 17 日
type
status
summary
date
slug
tags
category
password
icon
- 《Joey: 上影全球AI电影马拉松/最佳叙事奖—种子创作思路分享》关键词学社的小伙伴们获得了上影的最佳叙事奖,8 万元的奖励。见证了 3 月从 0 开始学习和练习的小伙伴们飞速成长。
- 工具教程:Runway Gen-3 所有视频+prompt 集合。这是 Runway 即将推出的第三代模型中的首个版本,这些模型在为大规模多模式训练而构建的新基础设施上进行训练。与 Gen-2 相比,它在保真度、一致性和运动方面有了重大改进。
- 《平庸且保守,但苹果或是 AI 落地的最大赢家》来自硅谷 101 对苹果 WWDC 发布会的深度解读,苹果的 AI 技术究竟如何?能否在端侧模型上实现技术领先?与 OpenAI 的合作是否存在安全隐患?AI 应用是否将迎来爆发期?苹果对硬件和 AI 交互的未来布局又将如何?硅谷 101 带着这些问题,采访了 AI 模型研究员、应用开发者、一二级投资人等。这期视频,将为大家揭开苹果 AI 战略的神秘面纱。
- 《拯救 Transformer 推理能力!DeepMind 新研究 TransNAR:给模型嵌入「算法推理大脑」》来自新智元,DeepMind 最新研究 TransNAR 将 Transformer 模型与神经算法推理器 (NAR) 相结合,提升了模型在算法推理任务中的能力。通过将 NAR 作为 Transformer 的调制器,并融合不同模态信息,实现了更好的推理泛化能力。实验结果表明,TransNAR 在大规模数据集上取得了显著优势,为解决 Transformer 推理能力不足提供了新思路。
- 《LLM 最全「怪癖」首曝光!马里兰 OpenAI 等 30+学者祭出 75 页提示报告》这份报告总结了 30 多名研究者对 LLM 提示技术的系统研究,揭示了一些奇怪的现象。比如,重复某些内容可以提高模型准确性,而人名匿名会降低准确性。研究者建议提示工程师与专家密切合作,探索如何控制模型的提示,因为这些 AI 系统对提示细节非常敏感。
- 《YoYo:我在通往AGI的学习之路心得》感谢 YoYo 同学的投稿,来自她作为「通往 AGI 之路」知识库的初学者体验,也希望能够给更多新人以帮助,我特别喜欢她用画板建立的学习路径,非常直观!
- 本周即将开启第三轮 Agent 共学活动,本轮围绕的主题是:如何用 Agent 搭建智能微信助手 / 微信机器人,活动预告如下:Agent 搭建共学快闪 0619
🔔Xiaohu.AI 日报「6 月 17 日」
✨✨✨✨✨✨✨✨
1⃣️
💻NVIDIA 发布 Nemotron-4 340B 开源模型
- 主要用途:生成高质量的合成数据
- 功能:生成多样化的合成数据,模仿现实世界的数据特征
- 应用:开发者可用于生成合成数据,训练适用于医疗、金融、制造和零售等行业的大型大语言模型 🔗 详细:https://xiaohu.ai/p/9732 🔗 https://x.com/imxiaohu/status/1802525900954902622?s=46
2⃣️
🔊基于 ChatTTS 2600个音色库稳定性评分
- 分类:按性别和年龄分类,可试听
- 目的:提供系统化的方法评估和打分不同音色,帮助用户选择适合不同应用场景的音色 🔗 详细介绍:https://xiaohu.ai/p/9827 🔗 查看:https://huggingface.co/spaces/taa/ChatTTS_Speaker 🔗 https://x.com/imxiaohu/status/1802546129013510376?s=46
3⃣️
💡加州大学研发出新的 Transformer 架构显著减少大模型对GPU的依赖
- 内存优化:内存使用减少高达61%
- 推理过程中:内存消耗减少10倍以上
- 速度提升:使用优化后的内核,推理速度提升4.57倍 🔗 详细介绍:https://xiaohu.ai/p/9841 🔗 https://x.com/imxiaohu/status/1802615643650609436?s=46
4⃣️
🤖麻省理工开发出 AI 聊天机器人 Future You
- 功能:互动性、单次会话的数字聊天干预系统
- 特点:用户可上传自己的照片,系统生成他们60岁时的形象
- 实验结果:与未来的自己对话后,负面情绪显著减少 🔗 详细内容:https://xiaohu.ai/p/9850 🔗 https://x.com/imxiaohu/status/1802658013754564959?s=46
5⃣️
🌟Luma AI 发布预告 Dream Machine 将推出强大的编辑功能和更直观的控制功能
- 功能:用户可以进行各种复杂的修改和调整
- 新功能:“Extend”视频功能,能够读懂视频内容,并根据提示在保持与视频一致的情况下延长视频长度 🔗 https://x.com/imxiaohu/status/1802693810964885574?s=46
6⃣️
🎥Runway 推出新一代视频生成模型 Gen-3 Alpha
- 功能:精细时间控制
- 高级控制模式:运动画笔(Motion Brush)、先进摄像头控制(Advanced Camera Controls)、导演模式(Director Mode) 🔗 详细内容:https://xiaohu.ai/p/9862 🔗 https://x.com/imxiaohu/status/1802704881574420917?s=46
7⃣️
🖥️DeepSeek 发布开源模型 DeepSeek-Coder-V2
- 优势:代码和数学能力超越GPT-4-Turbo
- 表现:在中英通用能力上也表现出色,位列国内第一梯队 🔗 详细介绍:https://xiaohu.ai/p/9861 🔗 https://x.com/imxiaohu/status/1802712033126912099?s=46