直达「 通往AGI之路 」飞书知识库 →
小互日报-2 月 15 日
资讯|2024-2-15|最后更新: 2024-2-20
type
status
summary
date
slug
tags
category
password
icon
1⃣️
🎨 ConsiStory:无需额外训练的连续一致图像生成工具。
  • 根据多个文本提示生成一致主题与布局多样的图像系列。
  • 类似于一键生成一组风格一致的漫画不同场景。
  • 项目及演示:https://consistory-paper.github.io
  • 论文:https://arxiv.org/abs/2402.03286
🔗 https://x.com/xiaohuggg/status/1758131675094274089?s=20
2⃣️
🤖 Vicarious:创新的腹部手术机器人。
  • 通过1.5厘米小切口完成手术,减少伤害和恢复时间。
  • 28个传感器装备的机器人手臂模仿医生上半身动作,提供360度3D视野。
  • 官网:http://vicarioussurgical.com
🔗 https://x.com/xiaohuggg/status/1758062271409053935?s=20
3⃣️
📜 美国专利商标局(USPTO):AI不能作为专利发明者。
  • 明确只有真人可申请专利,强调人类创造性和智慧的重要性。
  • 提供AI在发明过程中的角色示例,明确什么情况下的发明可获专利资格。
🔗 https://edition.cnn.com/2024/02/14/tech/billions-in-ai-patents-get-new-regulations/index.html
🔗 https://x.com/xiaohuggg/status/1758056275219567020?s=20
4⃣️
🔍 Lumos:端到端多模态问答系统。
  • 利用STR技术从复杂场景图像中准确提取文本。
  • 整合图像理解与语言处理,准确回答基于图像的查询。
  • 论文:https://arxiv.org/abs/2402.08017
🔗 https://x.com/xiaohuggg/status/1758028721486021055?s=20
5⃣️
🧬 GeneGPT:NCBI开发的生物医学专业知识处理工具。
  • 改进大语言模型对生物医学知识的处理能力。
  • 支持基因组DNA比对、蛋白编码基因识别等任务。
  • 论文:https://arxiv.org/abs/2304.09667
  • GitHub:https://github.com/ncbi/GeneGPT
🔗 https://x.com/xiaohuggg/status/1758012243529330923?s=20
6⃣️
👩🔬 FaceFusion 2.3.0:高精度面部识别技术更新。
  • 68点面部标记模型提升口型同步效果。
  • 优化算法处理面部边缘,增强稳定性和准确性。
  • 68点转5点简化模型,提高面部识别效率。
  • GitHub:https://github.com/facefusion/facefusion
🔗 https://x.com/xiaohuggg/status/1757998515308106186?s=20
7⃣️
🗣️ WhisperKit v0.2:让Whisper运行在Apple Watch。
  • 更高效,资源占用更少,优化语音识别处理。
  • GitHub:https://github.com/argmaxinc/WhisperKit
  • 模型:https://huggingface.co/argmaxinc/whisperkit-coreml
🔗 https://x.com/xiaohuggg/status/1757955251293082061?s=20
小互日报-2 月 16 日小互日报-2 月 14 日