Cargando…

Deep Modular Bilinear Attention Network for Visual Question Answering

VQA (Visual Question Answering) is a multi-model task. Given a picture and a question related to the image, it will determine the correct answer. The attention mechanism has become a de facto component of almost all VQA models. Most recent VQA approaches use dot-product to calculate the intra-modali...

Descripción completa

Detalles Bibliográficos
Autores principales:	Yan, Feng, Silamu, Wushouer, Li, Yanbing
Formato:	Online Artículo Texto
Lenguaje:	English
Publicado:	MDPI 2022
Materias:	Article
Acceso en línea:	https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8838230/ https://www.ncbi.nlm.nih.gov/pubmed/35161790 http://dx.doi.org/10.3390/s22031045

Ejemplares similares

An Effective Dense Co-Attention Networks for Visual Question Answering
por: He, Shirong, et al.
Publicado: (2020)

Multi-Modal Explicit Sparse Attention Networks for Visual Question Answering
por: Guo, Zihan, et al.
Publicado: (2020)

Adversarial Learning with Bidirectional Attention for Visual Question Answering
por: Li, Qifeng, et al.
Publicado: (2021)

Focal cross transformer: multi-view brain tumor segmentation model based on cross window and focal self-attention
por: Zongren, Li, et al.
Publicado: (2023)

Research on visual question answering based on dynamic memory network model of multiple attention mechanisms
por: Miao, Yalin, et al.
Publicado: (2022)

Lightweight Scene Text Recognition Based on Transformer
por: Luan, Xin, et al.
Publicado: (2023)

Parallel multi-head attention and term-weighted question embedding for medical visual question answering
por: Manmadhan, Sruthy, et al.
Publicado: (2023)

MedFuseNet: An attention-based multimodal deep learning model for visual question answering in the medical domain
por: Sharma, Dhruv, et al.
Publicado: (2021)

Calling Attention to Passages for Biomedical Question Answering
por: Almeida, Tiago, et al.
Publicado: (2020)

The multi-modal fusion in visual question answering: a review of attention mechanisms
por: Lu, Siyu, et al.
Publicado: (2023)

Learning temporal attention in dynamic graphs with bilinear interactions
por: Knyazev, Boris, et al.
Publicado: (2021)

Histopathological Tissue Segmentation of Lung Cancer with Bilinear CNN and Soft Attention
por: Xu, Rui, et al.
Publicado: (2022)

An effective spatial relational reasoning networks for visual question answering
por: Shen, Xiang, et al.
Publicado: (2022)

Deep Question Answering for protein annotation
por: Gobeill, Julien, et al.
Publicado: (2015)

VisdaNet: Visual Distillation and Attention Network for Multimodal Sentiment Classification
por: Hou, Shangwu, et al.
Publicado: (2023)

Linguistic issues behind visual question answering
por: Bernardi, Raffaella, et al.
Publicado: (2021)

Questions and Answers
Publicado: (1887)

Diabetic Retinal Grading Using Attention-Based Bilinear Convolutional Neural Network and Complement Cross Entropy
por: Liu, Pingping, et al.
Publicado: (2021)

Bilinear Control Systems
por: Elliott, David
Publicado: (2009)

Bilinear transformation method
por: Matsuno, Yoshimasa
Publicado: (1984)

Symmetric bilinear forms
por: Milnor, John, et al.
Publicado: (1973)

Questions and answers
por: Jones, Rhodri, et al.
Publicado: (2022)

The Question Answered
por: Smith, C. Carleton
Publicado: (1881)

Questions and Answers
Publicado: (1895)

Questions & Answers
por: CERN. Geneva
Publicado: (2019)

Questions and answers
por: Jones, Rhodri, et al.
Publicado: (2023)

Scene Uyghur Recognition Based on Visual Prediction Enhancement
por: Liu, Yaqi, et al.
Publicado: (2023)

UsbVisdaNet: User Behavior Visual Distillation and Attention Network for Multimodal Sentiment Classification
por: Hou, Shangwu, et al.
Publicado: (2023)

A parallel attention‐augmented bilinear network for early magnetic resonance imaging‐based diagnosis of Alzheimer's disease
por: Guan, Hao, et al.
Publicado: (2021)

Intelligent Question Answering System by Deep Convolutional Neural Network in Finance and Economics Teaching
por: Chen, Ping, et al.
Publicado: (2022)

COIN: Counterfactual Image Generation for Visual Question Answering Interpretation
por: Boukhers, Zeyd, et al.
Publicado: (2022)

Multi-View Visual Question Answering with Active Viewpoint Selection
por: Qiu, Yue, et al.
Publicado: (2020)

Vision–Language Model for Visual Question Answering in Medical Imagery
por: Bazi, Yakoub, et al.
Publicado: (2023)

List-wise learning to rank biomedical question-answer pairs with deep ranking recursive autoencoders
por: Yan, Yan, et al.
Publicado: (2020)

Multi-modal adaptive gated mechanism for visual question answering
por: Xu, Yangshuyi, et al.
Publicado: (2023)

Automatic question answering for multiple stakeholders, the epidemic question answering dataset
por: Goodwin, Travis R., et al.
Publicado: (2022)

Bilinear algebra : an introduction to the algebraic theory of quadratic forms /
por: Szymiczek, Kazimierz
Publicado: (1997)

Question Sets and Answers
por: de Virgilio, Christian
Publicado: (2014)

An Important Question Answered
por: Suess, Henry C.
Publicado: (1885)

Learning to Reason on Tree Structures for Knowledge-Based Visual Question Answering
por: Li, Qifeng, et al.
Publicado: (2022)

Cannot write session to /tmp/vufind_sessions/sess_6inumoj16tcklfia46g3o0ro2t