Visual Parsing with Query-Driven Global Graph Attention (QD-GGA): Preliminary Results for Handwritten Math Formula Recognition

Mahshad Mahdavi, Leilei Sun, Richard Zanibbi

CVPRW 2020 pp. 2429-2438

doi:10.1109/CVPRW50498.2020.00293 /cvprw/2020/mahdavi2020cvprw-visual/

Abstract

We present a new visual parsing method based on convolutional neural networks for handwritten mathematical formulas. The Query-Driven Global Graph Attention (QD-GGA) parsing model employs multi-task learning, and uses a single feature representation for locating, classifying, and relating symbols. First, a Line-Of-Sight (LOS) graph is computed over the handwritten strokes in a formula. Second, class distributions for LOS nodes and edges are obtained using query-specific feature filters (i.e., attention) in a single feed-forward pass. Finally, a Maximum Spanning Tree (MST) is extracted from the weighted graph. Our preliminary results show that this is a promising new approach for visual parsing of handwritten formulas. Our data and source code are publicly available.

CVPRW Semantic Scholar

Cite

Text

Mahdavi et al. "Visual Parsing with Query-Driven Global Graph Attention (QD-GGA): Preliminary Results for Handwritten Math Formula Recognition." IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops, 2020. doi:10.1109/CVPRW50498.2020.00293

Markdown

[Mahdavi et al. "Visual Parsing with Query-Driven Global Graph Attention (QD-GGA): Preliminary Results for Handwritten Math Formula Recognition." IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops, 2020.](https://mlanthology.org/cvprw/2020/mahdavi2020cvprw-visual/) doi:10.1109/CVPRW50498.2020.00293

BibTeX

@inproceedings{mahdavi2020cvprw-visual,
  title     = {{Visual Parsing with Query-Driven Global Graph Attention (QD-GGA): Preliminary Results for Handwritten Math Formula Recognition}},
  author    = {Mahdavi, Mahshad and Sun, Leilei and Zanibbi, Richard},
  booktitle = {IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops},
  year      = {2020},
  pages     = {2429-2438},
  doi       = {10.1109/CVPRW50498.2020.00293},
  url       = {https://mlanthology.org/cvprw/2020/mahdavi2020cvprw-visual/}
}