Prompting Video-Language Foundation Models with Domain-specific Fine-grained Heuristics for Video Question Answering

Ting Yu, Kunhao Fu,Shuhui Wang,Qingming Huang,Jun Yu

IEEE Trans Circuits Syst Video Technol（2025）

引用 0|浏览17

关键词

video question answering,discriminative unimodal comprehension,cross-modal interaction,domain-specific heuristics,video-language foundation models,entity-action relationships,context-aware reasoning

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要