30
06
2023
谷歌AudioPaLM实现「文本+音频」双模态解决,说听两用大模型
大型语言模型以其强大的性能及通用性,带动了一批多模态的大模型开发,如音频、视频等。语言模型的底层架构大多是基于Transformer,且以解码器为主,所以无需过多调整模型架构即可适应其他序列模态。最近...
27
06
2023
70年前他本想逃避考试,却影响了整个互联网
谁曾想,一次学生不想参加考试的“任性”,后来竟影响了整个互联网。70年前MIT的一堂信息论课上,一位老师为了给学生“减压”,摆出一道选择题。要么参加期末考试,要么写篇论文改进现有算法,自己挑。这位老师...




