CLIP是一种多模态模型,它结合了哪两种类型的信息?
选项:
A: 文本和图像
B: 音频和文本
C: 图像和音频
D: 文本和音频
发布时间:2024-06-05 20:02:32
以下文字与答案无关
提示:有些试题内容 显示不完整,文字错误 或者 答案显示错误等问题,这是由于我们在扫描录入过程中 机器识别错误导致,人工逐条矫正总有遗漏,所以恳请 广大网友理解。