直达「 通往AGI之路 」飞书知识库 →
小互日报-2 月 28 日
小互日报-2 月 28 日
资讯|2024-2-28|最后更新: 2024-2-29
type
status
summary
date
slug
tags
category
password
icon
1⃣️
🎵 Google MusicFX的DJ打碟模式:
  • 允许用户选择多个音乐风格生成音乐。
  • 可调整风格强度控制节奏和曲调。
  • 实现类似DJ的音乐编辑生成。
🔗 https://aitestkitchen.withgoogle.com/tools/music-fx?isMusicFxLive=true
🔗 https://x.com/xiaohuggg/status/1762825532650172472?s=20
 
2⃣️
🔄 AutoPrompt的提示优化框架:
  • 设计用于优化提示词,自动生成定制化提示。
  • 解决敏感性和模糊性问题,提升提示质量。
  • 通过迭代构建挑战性数据集,理解用户意图。
🔗 https://x.com/xiaohuggg/status/1762786980721832233?s=20
 
3⃣️
🤖 EMO动态视频生成技术:
  • 通过照片和音频生成动态视频。
  • 视频长度与音频匹配,表情非常到位。
  • 支持任意语音、速度、图像。
🔗 https://humanaigc.github.io/emote-portrait-alive/
🔗 https://arxiv.org/abs/2402.17485
🔗 https://x.com/xiaohuggg/status/1762726320008823186?s=20
 
4⃣️
🎶 ChatMusician音乐生成模型:
  • 理解和生成结构完整、风格多样的音乐。
  • 使用ABC符号,让模型“阅读”和“写作”音乐。
  • 结合了文本和音乐的表示方式。
🔗 https://shanghaicannon.github.io/ChatMusician/
🔗 https://arxiv.org/abs/2402.16153
🔗 https://x.com/xiaohuggg/status/1762698955249569941?s=20
 
5⃣️
🕰️ GPT生成器的“历史记录”功能:
  • 新增“版本历史记录”按钮,防止Prompt丢失。
  • 允许恢复到自定义GPT的任意先前版本。
🔗 https://x.com/xiaohuggg/status/1762659489273299313?s=20
notion image
 
6⃣️
📞 X的语音和视频通话功能全面开放:
  • 今天开始向所有用户开放语音视频通话。
  • 马斯克宣布未来只能通过X联系他。
🔗 https://x.com/xiaohuggg/status/1762658710403657732?s=20
notion image
 
7⃣️
🎨 Playground v2.5文本到图像模型:
  • 显著提升图像美学质量,包括颜色和对比度。
  • 改进多纵横比图像生成和人像细节。
  • 性能大幅超越其他主流模型。
🔗 http://playground.com
🔗 https://x.com/xiaohuggg/status/1762649962113114458?s=20
 
8⃣️
👄 Pika的Lip Sync唇部同步功能:
  • 通过语音或文字同步生成视频中的嘴部动画。
🔗 https://x.com/xiaohuggg/status/1762614742198403507?s=20
 
小互日报-2 月 29 日小互日报-2 月 27 日