Mapping Political-Elite Networks in Europe with a Multilingual Joint Entity-Relation Extraction Pipeline
Whether political elites organise into rent-seeking coalitions that capture public resources or civic networks that sustain governance is a central question in comparative politics. Yet observing these complex, informal, and adversarial ties at scale has historically required intensive manual coding, while automated text-as-data methods have largely been limited to simple co-occurrence. Recent large language model (LLM) approaches offer a path forward but often rely on proprietary APIs, lack cross-lingual capability, and struggle with scalable entity resolution. We present a modular, fully open-weight pipeline for multilingual joint entity-relation extraction that builds signed, temporal knowledge graphs from massive unstructured news corpora. It combines span-based named-entity recognition (NER) with a three-stage linking cascade mapping mentions to language-independent Wikidata identifiers; a high-throughput, ontology-constrained mixture-of-experts model then uses guided decoding to extract directed, signed relationships grounded in a domain ontology. A full-coverage spot-check against a 3491-relation gold standard shows high textual correctness (68.2% strict to 93.7% lenient). Two large-scale case studies validate the pipeline against the public record. In Austria, it reconstructs a political party's complete lifecycle, dating internal fractures and tracking personnel into successor factions and court convictions. In a Polish corpus, it uncovers the overlapping economic and governance networks of state-enterprise patronage, alongside the structurally balanced, signed conflict network of the polarized Civic Platform (Platforma Obywatelska, PO)--Law and Justice (Prawo i Sprawiedliwość, PiS) duopoly. By bridging raw multilingual text and structured relational data, our framework provides a robust, replicable foundation for cross-national empirical computational social science.
Image: Daily English Reader / Local generated SVG (Project-owned local asset)
B2 Version
Click any word for its Thai meaning.
สรุป/คำแปลไทย
ข่าวนี้มาจาก arXiv อยู่ในหมวดเทคโนโลยี และถูกเรียบเรียงเป็นระดับ B2. เนื้อหาข่าวคือ
ไม่ว่าชั้นนําทางการเมืองจะจัดสรรเป็นพันธมิตรที่มองหาค่าเช่าที่จับกุมทรัพยากรสาธารณะ หรือเครือข่ายพลเมืองที่สนับสนุนการปกครอง เป็นคําถามสําคัญในการเมืองเทียบเทียบ. แต่ การสังเกตการเชื่อมโยงที่ซับซ้อน ไม่เป็นทางการ และขัดแย้งในระดับขนาดนี้ ในประวัติศาสตร์ที่ผ่านมาจําเป็นต้องมีการเขียนโค้ดแบบมือหนัก ขณะที่วิธีการอัตโนมัติของข้อความเป็นข้อมูล มีส่วนมากจํากัดกับการเกิดขึ้นร่วมกันง่าย ๆ. แนวทางแบบภาษาขนาดใหญ่ (LLM) ล่าสุดเสนอแนวทางไปข้างหน้า แต่มักขึ้นอยู่กับ API เจ้าของ, ไม่มีความทำได้ระหว่างภาษา, และต่อสู้กับการแก้ไขขององค์กรที่ทำได้ปรับขนาดได้.
เรานําเสนอแนวโน้มแบบจํากัด ที่เปิดเต็มที่ สำหรับการถอนตัวประกอบความสัมพันธ์ขององค์กรร่วมกันหลายภาษา ซึ่งสร้างกราฟความรู้ในระยะเวลา จากองค์กรข่าวที่ไม่ทรงโครงสร้างขนาดใหญ่. มันรวมตัวกระบุหน่วยที่มีชื่อ (NER) โดยใช้ระยะเวลา 3 ระยะที่เชื่อมโยงการอ้างอิงการจัดแผนที่กระจกไปยังตัวประชากร Wikidata ที่อิสระจากภาษา; รูปแบบผสมผู้เชี่ยวชาญที่มีผลิตสูงและจํากัดจาก ontology จากนั้นใช้การบรอกคําแนะนําเพื่อดึงออกความสัมพันธ์ที่ถูกกํากับและเซ็นสัญญาก็องเน้นใน ontology domain. การตรวจสอบสป็อตแบบครบวงจรกับมาตรฐานทองคํา 3491 ราศีแสดงให้เห็นความถูกต้องของบทความสูง (68.2% ละเอียดถึง 93.7% ละเอียด).
การศึกษาคดีขนาดใหญ่สองรายการ ยืนยันว่าการดําเนินงานนี้เป็นไปตามบันทึกสาธารณะ. ในออสเตรีย มันสร้างใหม่วงจรชีวิตของพรรคการเมืองทั้งหมด โดยกําหนดความแตกแยกภายในและติดตามบุคลากรเป็นฝ่ายต่อมาและคําตัดสินของศาล.
Save & Review
Only words saved from this story appear here.