Cargando…

Multi-modal adaptive gated mechanism for visual question answering

Visual Question Answering (VQA) is a multimodal task that uses natural language to ask and answer questions based on image content. For multimodal tasks, obtaining accurate modality feature information is crucial. The existing researches on the visual question answering model mainly start from the p...

Descripción completa

Detalles Bibliográficos
Autores principales:	Xu, Yangshuyi, Zhang, Lin, Shen, Xiang
Formato:	Online Artículo Texto
Lenguaje:	English
Publicado:	Public Library of Science 2023
Materias:	Research Article
Acceso en línea:	https://www.ncbi.nlm.nih.gov/pmc/articles/PMC10306234/ https://www.ncbi.nlm.nih.gov/pubmed/37379280 http://dx.doi.org/10.1371/journal.pone.0287557

Ejemplares similares

The multi-modal fusion in visual question answering: a review of attention mechanisms
por: Lu, Siyu, et al.
Publicado: (2023)

Multi-Modal Explicit Sparse Attention Networks for Visual Question Answering
por: Guo, Zihan, et al.
Publicado: (2020)

An effective spatial relational reasoning networks for visual question answering
por: Shen, Xiang, et al.
Publicado: (2022)

Multi-View Visual Question Answering with Active Viewpoint Selection
por: Qiu, Yue, et al.
Publicado: (2020)

Parallel multi-head attention and term-weighted question embedding for medical visual question answering
por: Manmadhan, Sruthy, et al.
Publicado: (2023)

Linguistic issues behind visual question answering
por: Bernardi, Raffaella, et al.
Publicado: (2021)

Questions and Answers
Publicado: (1887)

Adversarial Learning with Bidirectional Attention for Visual Question Answering
por: Li, Qifeng, et al.
Publicado: (2021)

Questions and answers
por: Jones, Rhodri, et al.
Publicado: (2023)

Questions & Answers
por: CERN. Geneva
Publicado: (2019)

Questions and answers
por: Jones, Rhodri, et al.
Publicado: (2022)

The Question Answered
por: Smith, C. Carleton
Publicado: (1881)

Questions and Answers
Publicado: (1895)

Vision–Language Model for Visual Question Answering in Medical Imagery
por: Bazi, Yakoub, et al.
Publicado: (2023)

An Effective Dense Co-Attention Networks for Visual Question Answering
por: He, Shirong, et al.
Publicado: (2020)

Deep Modular Bilinear Attention Network for Visual Question Answering
por: Yan, Feng, et al.
Publicado: (2022)

COIN: Counterfactual Image Generation for Visual Question Answering Interpretation
por: Boukhers, Zeyd, et al.
Publicado: (2022)

A question-entailment approach to question answering
por: Ben Abacha, Asma, et al.
Publicado: (2019)

Automatic question answering for multiple stakeholders, the epidemic question answering dataset
por: Goodwin, Travis R., et al.
Publicado: (2022)

Question Sets and Answers
por: de Virgilio, Christian
Publicado: (2014)

An Important Question Answered
por: Suess, Henry C.
Publicado: (1885)

BPI-MVQA: a bi-branch model for medical visual question answering
por: Liu, Shengyan, et al.
Publicado: (2022)

Questions & Answers discussion
por: Henriques, Andre
Publicado: (2023)

Questions and Answers to panellists
por: Wijnands, Thijs
Publicado: (2019)

Questions and Answers to panellists
por: Purcell, Andrew Robert
Publicado: (2018)

Questions & answers to panellists
por: CERN. Geneva
Publicado: (2018)

AIDS: questions and answers
Publicado: (1987)

The logic of questions and answers
por: Belnap, Nuel D, et al.
Publicado: (1976)

QUESTIONS AND ANSWERS FOR THE DRCOG
por: Costa, Janitha
Publicado: (2011)

Further Questions and Answers
Publicado: (1917)

Diversity is the question, not the answer
por: Shade, Ashley
Publicado: (2017)

Your questions answered
por: Hamzelou, Jessica, et al.
Publicado: (2020)

Answering the endocrine test questions.
por: Schmidt, C W
Publicado: (1999)

Research on visual question answering based on dynamic memory network model of multiple attention mechanisms
por: Miao, Yalin, et al.
Publicado: (2022)

Factoid Question Answering with Distant Supervision
por: Zhang, Hongzhi, et al.
Publicado: (2018)

Question Popularity Analysis and Prediction in Community Question Answering Services
por: Liu, Ting, et al.
Publicado: (2014)

Learning to Reason on Tree Structures for Knowledge-Based Visual Question Answering
por: Li, Qifeng, et al.
Publicado: (2022)

Brief answers to the big questions
por: Hawking, Stephen
Publicado: (2018)

Questions and Answers about CERN
Publicado: (1960)

Final questions, final answers
por: HAUSCHILD, Michael
Publicado: (2015)

Cannot write session to /tmp/vufind_sessions/sess_rm59q8ffap2d80e04or1uemdlr