Autoregressive Boltzmann Generators
Efficient sampling of molecular systems at thermodynamic equilibrium is a hallmark challenge in statistical physics. This challenge has driven the development of Boltzmann Generators (BGs), which allow rapid generation of uncorrelated equilibrium samples by combining a generative model with exact likelihoods and an importance sampling correction. However, modern BGs predominantly rely on normalizing flows (NFs), which either suffer from limited expressivity due to strict invertibility constraints (discrete time) or computationally expensive likelihoods (continuous time). In this paper, we propose Autoregressive Boltzmann Generators (ArBG) -- a novel autoregressive modelling framework -- that overcomes these limitations by departing from the flow-based BG paradigm. ArBG circumvents the topological constraints of flows and enables sequential inference-time interventions, while offering enhanced scalability by leveraging architectures effective in Large Language Models. We empirically demonstrate that ArBG leads to significant improvements over flow-based models across all benchmarks, but particularly in larger peptide systems such as the 10-residue Chignolin. Furthermore, we introduce Robin, a 132 million parameter transferable model trained with the ArBG framework which improves over the previous state-of-the-art, reducing the zero-shot energy error, E-W$_2$, on 8-residue systems by over 60$\%$. The code can be found at the following link: https://github.com/danyalrehman/autobg.
Image: Daily English Reader / Local generated SVG (Project-owned local asset)
B2 Version
Click any word for its Thai meaning.
สรุป/คำแปลไทย
ข่าวนี้มาจาก arXiv อยู่ในหมวดเทคโนโลยี และถูกเรียบเรียงเป็นระดับ B2. เนื้อหาข่าวคือ
การเก็บตัวอย่างอย่างอย่างมีประสิทธิภาพของระบบโมเลกุลที่สมดุลภาพทางเทอร์โมไดนามิก เป็นความท้าทายที่สําคัญในฟิสิกส์สถิติศาสตร์. ความท้าทายนี้ได้ผลักดันการพัฒนาของ Boltzmann Generators (BGs) ที่อนุญาตให้เกิดตัวอย่างสมดุลที่ไม่เกี่ยวข้องอย่างรวดเร็ว โดยการรวมตัวอย่างการสร้างตัวอย่างกับความน่าจะเป็นแม่นยําและการปรับตัวอย่างความสําคัญ. แต่ บีจีสมัยใหม่มักขึ้นอยู่กับการกระจายการปกติ (NFs) ซึ่งอาจมีความแสดงออกที่จํากัด เพราะมีข้อจํากัดในการเปลี่ยนแปลงที่เข้มข้น (เวลาค่อนข้าง) หรือโอกาสที่แพงจากการคํานวณ (เวลาต่อเนื่อง).
ในบทความนี้ เรานําเสนอ Generators Boltzmann Autoregressive (ArBG) -- รูปแบบจําลองแบบ autoregressive ใหม่ -- ที่ทำได้เอาชนะข้อจํากัดเหล่านี้ได้ โดยการแยกทางจาก BG แพราไกด์ม์ที่ขึ้นอยู่กับการไหล. ArBG หลีกเลี่ยงข้อจํากัดทางทอปโลจิกของกระแสและทำให้มีการแทรกแซมเวลาการสรุปตามลําดับได้ ขณะที่นําเสนอความทำได้ในการปรับขนาดได้ดีขึ้น โดยใช้สถาปัตยกรรมที่มีประสิทธิภาพในโมเดลภาษาขนาดใหญ่. เราพิสูจน์โดยท่องทัศน์ว่า ArBG ส่งผลให้มีการปรับปรุงที่สําคัญต่อแบบที่ขึ้นอยู่กับการไหล across all benchmarks แต่โดยเฉพาะในระบบ peptide ที่ใหญ่กว่า เช่น Chignolin ที่เหลือ 10.
นอกจากนี้ เรานําเสนอโรบิน รูปแบบที่ทำได้โอนปารามีเตอร์ได้ 132 ล้านตัว โดยได้รับการฝึกอบรมกับกรอบ ArBG ซึ่งปรับปรุงเทพเหนือกับเกมที่ผ่านมา โดยลดความผิดพลาดของพลังงานแบบศูนย์ฉีด E-W$_2$ ในระบบเหลือ 8 มากกว่า 60$\%$.
Save & Review
Only words saved from this story appear here.