Lu, Yuxiao

2 publications

ICLR 2025 Semantic Loss Guided Data Efficient Supervised Fine Tuning for Safe Responses in LLMs Yuxiao Lu, Arunesh Sinha, Pradeep Varakantham

AAAI 2024 Handling Long and Richly Constrained Tasks Through Constrained Hierarchical Reinforcement Learning Yuxiao Lu, Arunesh Sinha, Pradeep Varakantham