小互日报-2 月 28 日
type
status
summary
date
slug
tags
category
password
icon
1⃣️
🎵 Google MusicFX的DJ打碟模式:
- 允许用户选择多个音乐风格生成音乐。
- 可调整风格强度控制节奏和曲调。
- 实现类似DJ的音乐编辑生成。
🔗 https://aitestkitchen.withgoogle.com/tools/music-fx?isMusicFxLive=true
🔗 https://x.com/xiaohuggg/status/1762825532650172472?s=20
2⃣️
🔄 AutoPrompt的提示优化框架:
- 设计用于优化提示词,自动生成定制化提示。
- 解决敏感性和模糊性问题,提升提示质量。
- 通过迭代构建挑战性数据集,理解用户意图。
🔗 https://x.com/xiaohuggg/status/1762786980721832233?s=20
3⃣️
🤖 EMO动态视频生成技术:
- 通过照片和音频生成动态视频。
- 视频长度与音频匹配,表情非常到位。
- 支持任意语音、速度、图像。
🔗 https://humanaigc.github.io/emote-portrait-alive/
🔗 https://arxiv.org/abs/2402.17485
🔗 https://x.com/xiaohuggg/status/1762726320008823186?s=20
4⃣️
🎶 ChatMusician音乐生成模型:
- 理解和生成结构完整、风格多样的音乐。
- 使用ABC符号,让模型“阅读”和“写作”音乐。
- 结合了文本和音乐的表示方式。
🔗 https://shanghaicannon.github.io/ChatMusician/
🔗 https://arxiv.org/abs/2402.16153
🔗 https://x.com/xiaohuggg/status/1762698955249569941?s=20
5⃣️
🕰️ GPT生成器的“历史记录”功能:
- 新增“版本历史记录”按钮,防止Prompt丢失。
- 允许恢复到自定义GPT的任意先前版本。
🔗 https://x.com/xiaohuggg/status/1762659489273299313?s=20
6⃣️
📞 X的语音和视频通话功能全面开放:
- 今天开始向所有用户开放语音视频通话。
- 马斯克宣布未来只能通过X联系他。
🔗 https://x.com/xiaohuggg/status/1762658710403657732?s=20
7⃣️
🎨 Playground v2.5文本到图像模型:
- 显著提升图像美学质量,包括颜色和对比度。
- 改进多纵横比图像生成和人像细节。
- 性能大幅超越其他主流模型。
🔗 http://playground.com
🔗 https://x.com/xiaohuggg/status/1762649962113114458?s=20
8⃣️
👄 Pika的Lip Sync唇部同步功能:
- 通过语音或文字同步生成视频中的嘴部动画。
🔗 https://x.com/xiaohuggg/status/1762614742198403507?s=20