知识库精选- 6 月 2 日
type
status
summary
date
slug
tags
category
password
icon
- 《Science in the age of AI》由英国皇家学会发布,科学与人工智能报告概述了人工智能(AI)在科学领域的快速发展及其广泛应用,特别是在气候科学、材料科学和罕见疾病诊断等领域。报告指出,AI技术通过处理和分析大量复杂数据,能够识别新的模式和关系,促进科学发现。同时,AI的模拟和生成能力使得科学家能够进行更准确的模拟和创建合成数据,从而帮助决策者更好地评估潜在干预措施的效果,解决社会和环境问题 。
- ComfyUI 全球领导力峰会🏆 感谢大家在首届 ComfyUI 全球领导力峰会首日的热情参与与积极互动!你们的热情点燃了整个会场,为开源与创新带来了无尽的动力。看到这么多朋友对 ComfyUI 充满热情,并踊跃参与讨论与分享,令我们备受鼓舞。
🔔Xiaohu.AI日报「6月1日 ~ 6月2日」
✨✨✨✨✨✨✨✨
1⃣
👍你能多快适应一个额外的拇指?
- 剑桥大学医学研究委员会认知与脑科学部门的塑性实验室在皇家学会夏季展览会上测试了Dani Clode设计的机器人第三拇指。
- 结果显示,公众发现适应这个设备非常容易。
- 强调在不同人群中测试技术对于确保新技术的包容性和普适性至关重要。 🔗 https://x.com/dotey/status/1796766580149227930
2⃣
🎨Consistent Character:保持角色一致性同时生成不同姿势图像
- 结合多种技术实现角色的一致性图像生成。
- 能生成给定角色的不同姿势图像,确保图像在姿势变化时保持角色的一致性。 🔗 https://x.com/imxiaohu/status/1796789253210595656
3⃣
🎧ElevenLabs推出新的 AI 音频模型
- 能根据文本提示生成各种音效、短乐器曲目、音景和各种角色声音。 🔗 https://x.com/imxiaohu/status/1796799098596790543
4⃣
🖼接近生产级别的3D生成模型:Rodin Gen-1正式发布
- 在几十秒内通过文本生成高质量可直接使用的3D模型。
- 模型使用四边形构造,并具有逼真的材质效果。
- Rodin几乎达到了可以在实际项目和商业用途中直接应用的标准。
- 生成的3D模型质量非常高,细节丰富,足以满足生产级别的要求。 🔗 https://x.com/imxiaohu/status/1796811128380817552
5⃣
🌐ChatTTS官网上线,直接可以在线体验
- 另外还有人做了一个ChatTTS Web UI,可以自行部署。 🔗 ChatTTS Web UI:https://github.com/jianchang512/ChatTTS-ui 🔗 https://x.com/imxiaohu/status/1796883071045865571
6⃣
🛠Claude 3 全系支持函数调用工具Tool use
- 使Claude能够与外部工具和API交互,执行任务、处理数据,并提供更动态和准确的响应。 功能示例:
- 从非结构化文本中提取结构化数据
- 将自然语言请求转换为结构化API调用
- 通过搜索数据库或使用Web API回答问题
- 通过软件API自动化简单任务
- 协调多个Claude子代理执行细化任务
- 流媒体工具使用:减少等待时间,提供更顺畅、更自然的实时互动
- 强制工具使用
7⃣
💻Spacetop:世界上首款 AR(增强现实) 电脑
- 100 英寸大屏幕,取消传统物理显示屏,使用AR眼镜显示虚拟大屏。
- AR眼镜在明亮或阳光直射环境中自动调节光线,确保文本清晰可见。
- 内置AI功能,提供无限的AI工具工作空间和物理环境感知能力。 🔗 https://x.com/imxiaohu/status/1797114186486710316
8⃣
🧮提高Transformer模型处理复杂算术任务的能力的方法
- 传统的transformer在处理长数字序列时,难以准确跟踪和表示每个数字的位置。
- 引入一种新的位置嵌入方法(Abacus Embeddings),显著提高了transformer处理复杂算术任务的能力。
- 使其在训练仅一天后,能够准确处理多达100位数的加法问题,并且这种改进也能推广到乘法和排序等其他多步骤推理任务。 🔗 https://x.com/imxiaohu/status/1797143192653185407
9⃣
🎮NVIDIA发布数字人 AI 技术:NVIDIA ACE
- Avatar Cloud Engine (ACE)赋予游戏NPC智能对话功能,能直接生成数字人的语音和面部动画。
- 赋予游戏角色智能:ACE让NPC具有真实的对话能力,玩家可进行自然、智能的对话。
- 语音和面部动画:通过AI技术,ACE让游戏角色能“听”懂玩家,并通过语音合成和面部动画进行回复。
- 灵活部署:开发者可将ACE部署在云端或本地设备上,提供高质量的互动体验。
- 高效低延迟:ACE优化神经网络性能,确保游戏中的互动实时进行,避免延迟问题。 🔗 https://x.com/imxiaohu/status/1797286676316016749