Sordoni, Alessandro

35 publications

TMLR 2025 A Survey on Model MoErging: Recycling and Routing Among Specialized Experts for Collaborative Learning Prateek Yadav, Colin Raffel, Mohammed Muqeeth, Lucas Caccia, Haokun Liu, Tianlong Chen, Mohit Bansal, Leshem Choshen, Alessandro Sordoni

ICLRW 2025 Exploring Sparse Adapters for Scalable Merging of Parameter Efficient Experts Samin Yeasar Arnob, Zhan Su, Minseon Kim, Oleksiy Ostapenko, Doina Precup, Lucas Caccia, Alessandro Sordoni

NeurIPS 2025 Learning to Solve Complex Problems via Dataset Decomposition Wanru Zhao, Lucas Caccia, Zhengyan Shi, Minseon Kim, Weijia Xu, Alessandro Sordoni

ICLRW 2025 Training Plug N' Play Knowledge Modules with Deep Context Distillation Lucas Caccia, Alan Ansell, Ivan Vulić, Edoardo Ponti, Alessandro Sordoni

ICML 2025 VinePPO: Refining Credit Assignment in RL Training of LLMs Amirhossein Kazemnejad, Milad Aghajohari, Eva Portelance, Alessandro Sordoni, Siva Reddy, Aaron Courville, Nicolas Le Roux

NeurIPS 2024 Efficient Adversarial Training in LLMs with Continuous Attacks Sophie Xhonneux, Alessandro Sordoni, Stephan Günnemann, Gauthier Gidel, Leo Schwinn

NeurIPS 2024 Efficient Reinforcement Learning by Discovering Neural Pathways Samin Yeasar Arnob, Riyasat Ohib, Sergey Plis, Amy Zhang, Alessandro Sordoni, Doina Precup

NeurIPS 2024 Improving Context-Aware Preference Modeling for Language Models Silviu Pitis, Ziang Xiao, Nicolas Le Roux, Alessandro Sordoni

NeurIPSW 2024 Not All LLM Reasoners Are Created Equal Arian Hosseini, Alessandro Sordoni, Daniel Kenji Toyama, Aaron Courville, Rishabh Agarwal

NeurIPSW 2024 Not All LLM Reasoners Are Created Equal Arian Hosseini, Alessandro Sordoni, Daniel Kenji Toyama, Aaron Courville, Rishabh Agarwal

ICML 2024 Towards Modular LLMs by Building and Reusing a Library of LoRAs Oleksiy Ostapenko, Zhan Su, Edoardo Ponti, Laurent Charlin, Nicolas Le Roux, Lucas Caccia, Alessandro Sordoni

NeurIPSW 2024 VinePPO: Accurate Credit Assignment in RL for LLM Mathematical Reasoning Amirhossein Kazemnejad, Milad Aghajohari, Eva Portelance, Alessandro Sordoni, Siva Reddy, Aaron Courville, Nicolas Le Roux

NeurIPSW 2023 A Case Study of Instruction Tuning with Mixture of Parameter-Efficient Experts Oleksiy Ostapenko, Lucas Caccia, Zhan Su, Nicolas Le Roux, Laurent Charlin, Alessandro Sordoni

NeurIPS 2023 Joint Prompt Optimization of Stacked LLMs Using Variational Inference Alessandro Sordoni, Eric Yuan, Marc-Alexandre Côté, Matheus Pereira, Adam Trischler, Ziang Xiao, Arian Hosseini, Friederike Niedtner, Nicolas Le Roux

NeurIPS 2023 Multi-Head Adapter Routing for Cross-Task Generalization Lucas Page-Caccia, Edoardo Maria Ponti, Zhan Su, Matheus Pereira, Nicolas Le Roux, Alessandro Sordoni

TMLR 2023 Using Representation Expressiveness and Learnability to Evaluate Self-Supervised Learning Methods Yuchen Lu, Zhen Liu, Aristide Baratin, Romain Laroche, Aaron Courville, Alessandro Sordoni

ICLR 2022 Evaluating Distributional Distortion in Neural Language Modeling Benjamin LeBrun, Alessandro Sordoni, Timothy J. O'Donnell

ICLR 2022 Learning to Dequantise with Truncated Flows Shawn Tan, Chin-Wei Huang, Alessandro Sordoni, Aaron Courville

ICML 2021 Decomposed Mutual Information Estimation for Contrastive Representation Learning Alessandro Sordoni, Nouha Dziri, Hannes Schulz, Geoff Gordon, Philip Bachman, Remi Tachet Des Combes

AAAI 2021 Quantum-Inspired Neural Network for Conversational Emotion Recognition Qiuchi Li, Dimitris Gkoumas, Alessandro Sordoni, Jian-Yun Nie, Massimo Melucci

ICLR 2019 An Empirical Study of Example Forgetting During Deep Neural Network Learning Mariya Toneva, Alessandro Sordoni, Remi Tachet des Combes, Adam Trischler, Yoshua Bengio, Geoffrey J. Gordon

NeurIPS 2019 Metalearned Neural Memory Tsendsuren Munkhdalai, Alessandro Sordoni, Tong Wang, Adam Trischler

NeurIPS 2019 Ordered Memory Yikang Shen, Shawn Tan, Arian Hosseini, Zhouhan Lin, Alessandro Sordoni, Aaron C. Courville

ICLR 2019 Ordered Neurons: Integrating Tree Structures into Recurrent Neural Networks Yikang Shen, Shawn Tan, Alessandro Sordoni, Aaron Courville

ICML 2018 Augmented CycleGAN: Learning Many-to-Many Mappings from Unpaired Data Amjad Almahairi, Sai Rajeshwar, Alessandro Sordoni, Philip Bachman, Aaron Courville

ICML 2018 Focused Hierarchical RNNs for Conditional Sequence Processing Nan Rosemary Ke, Konrad Żołna, Alessandro Sordoni, Zhouhan Lin, Adam Trischler, Yoshua Bengio, Joelle Pineau, Laurent Charlin, Christopher Pal

NeurIPS 2018 Towards Text Generation with Adversarially Learned Neural Outlines Sandeep Subramanian, Sai Rajeswar Mudumba, Alessandro Sordoni, Adam Trischler, Aaron C. Courville, Chris Pal

ICLR 2018 Twin Networks: Matching the Future for Sequence Generation Dmitriy Serdyuk, Nan Rosemary Ke, Alessandro Sordoni, Adam Trischler, Chris Pal, Yoshua Bengio

AAAI 2017 A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues Iulian Vlad Serban, Alessandro Sordoni, Ryan Lowe, Laurent Charlin, Joelle Pineau, Aaron C. Courville, Yoshua Bengio

ICML 2017 Learning Algorithms for Active Learning Philip Bachman, Alessandro Sordoni, Adam Trischler

ICLR 2017 Learning Algorithms for Active Learning Philip Bachman, Alessandro Sordoni, Adam Trischler

NeurIPS 2017 Z-Forcing: Training Stochastic Recurrent Networks Anirudh Goyal ALIAS PARTH Goyal, Alessandro Sordoni, Marc-Alexandre Côté, Nan Rosemary Ke, Yoshua Bengio

AAAI 2016 Building End-to-End Dialogue Systems Using Generative Hierarchical Neural Network Models Iulian Vlad Serban, Alessandro Sordoni, Yoshua Bengio, Aaron C. Courville, Joelle Pineau

AAAI 2014 Compact Aspect Embedding for Diversified Query Expansions Xiaohua Liu, Arbi Bouchoucha, Alessandro Sordoni, Jian-Yun Nie

AAAI 2014 Learning Concept Embeddings for Query Expansion by Quantum Entropy Minimization Alessandro Sordoni, Yoshua Bengio, Jian-Yun Nie