FlexControl: Flexible and Efficient Full-Body Controllable Text-to-Motion Generation

Liu, Qingyuan; Lu, Ke; Niu, Zehai; Dong, Kun; Xue, Jian; Qin, Xiaoyu; Wang, Jinbao

doi:10.1007/978-3-031-91575-8_17

FlexControl: Flexible and Efficient Full-Body Controllable Text-to-Motion Generation

Qingyuan Liu, Ke Lu, Zehai Niu, Kun Dong, Jian Xue, Xiaoyu Qin, Jinbao Wang

ECCVW 2024 pp. 274-289

doi:10.1007/978-3-031-91575-8_17 /eccvw/2024/liu2024eccvw-flexcontrol/

Abstract

We present FlexControl, a novel approach for flexible and efficient full-body controllable text-to-motion generation in this paper. Unlike previous methods that focus on controlling specific parts of the body, FlexControl enables users to set different control strengths for various joints throughout the body, achieving a balance between motion precision and naturalness. Specifically, our approach is built upon a diffusion network. It introduces the innovative FlexGuide module, an additional control module that allows users to manually balance the influence of text descriptions and trajectory constraints on the generated motion. Furthermore, we propose a novel architecture called MotionAdapter, which dynamically adapts the motion generation process to external control signals while maintaining the integrity of the original text-to-motion model. Additionally, our method demonstrates excellent generation efficiency while maintaining high motion quality, enabling real-time interactive applications. Experimental results demonstrate that FlexControl can achieve high performance on full-body control accuracy, flexibility, generation efficiency, and motion realism.

PDF ECCVW Semantic Scholar

Cite

Text

Liu et al. "FlexControl: Flexible and Efficient Full-Body Controllable Text-to-Motion Generation." European Conference on Computer Vision Workshops, 2024. doi:10.1007/978-3-031-91575-8_17

Markdown

[Liu et al. "FlexControl: Flexible and Efficient Full-Body Controllable Text-to-Motion Generation." European Conference on Computer Vision Workshops, 2024.](https://mlanthology.org/eccvw/2024/liu2024eccvw-flexcontrol/) doi:10.1007/978-3-031-91575-8_17

BibTeX

@inproceedings{liu2024eccvw-flexcontrol,
  title     = {{FlexControl: Flexible and Efficient Full-Body Controllable Text-to-Motion Generation}},
  author    = {Liu, Qingyuan and Lu, Ke and Niu, Zehai and Dong, Kun and Xue, Jian and Qin, Xiaoyu and Wang, Jinbao},
  booktitle = {European Conference on Computer Vision Workshops},
  year      = {2024},
  pages     = {274-289},
  doi       = {10.1007/978-3-031-91575-8_17},
  url       = {https://mlanthology.org/eccvw/2024/liu2024eccvw-flexcontrol/}
}