Text
PENGEMBANGAN SISTEM TANYA JAWAB FILSAFAT ISLAM MENGGUNAKAN HYBRID RAG DENGAN CHROMA DB DAN NEO4J
Perkembangan teknologi kecerdasan buatan telah menghadirkan model bahasa besar (Large Language Model/LLM) seperti GPT, yang mampu memahami konteks dan menghasilkan jawaban dalam bahasa alami. Salah satu penerapannya adalah pada sistem tanya jawab berbasis teks. Namun, LLM memiliki keterbatasan dalam menjawab pertanyaan yang memerlukan pengetahuan spesifik, seperti topik filsafat Islam, karena jawaban yang dihasilkan cenderung bersifat umum, kurang relevan, dan tidak selalu akurat. Filsafat Islam klasik memiliki karakteristik kompleks, di mana sumber pengetahuan tersebar dalam berbagai bentuk dokumen, termasuk teks klasik seperti Tah?fut al-Fal?sifah karya Al-Ghazali, sehingga membutuhkan sistem yang mampu mengakses dan memanfaatkan informasi terstruktur maupun tidak terstruktur secara efektif. Penelitian ini bertujuan untuk mengembangkan sistem tanya jawab berbasis filsafat Islam dengan pendekatan Hybrid Retrieval-Augmented Generation (Hybrid RAG), yang mengintegrasikan Chroma DB sebagai vector store untuk pencarian semantik dan Neo4j sebagai graph database untuk merepresentasikan hubungan antar konsep. Dengan kombinasi ini, sistem diharapkan mampu menghasilkan jawaban yang lebih akurat, relevan, dan kontekstual dibandingkan dengan sistem RAG konvensional. Tahapan metode penelitian diawali dengan persiapan dan pembersihan data (preprocessing) pada kitab Tah?fut al-Fal?sifah, yang meliputi ekstraksi PDF, penyaringan halaman spesifik untuk mengambil konten utama, perbaikan hyphenation, serta penerapan semantic tagging untuk membedakan argumen filsuf dan bantahan Al-Ghazali. Tahap selanjutnya adalah pembangunan basis pengetahuan, di mana teks dipecah menggunakan RecursiveCharacterTextSplitter dan dikonversi menjadi vektor menggunakan model text-embedding-3-large ke dalam ChromaDB. Secara paralel, dibangun Knowledge Graph pada Neo4j untuk memetakan relasi antara masalah, tokoh, argumen, dan konsep. Implementasi sistem menggunakan mekanisme Hybrid Retrieval yang menggabungkan pencarian kesamaan (similarity search) dan Cypher Query, yang kemudian diproses oleh model gpt-4o-mini. Untuk interaksi pengguna,dikembangkan antarmuka berbasis web menggunakan framework Streamlit. Dasbor ini dirancang dengan navigasi sidebar dan tiga modul utama: fitur perbandingan jawaban side-by-side antara Standard RAG dan Hybrid RAG, visualisasi grafik batang untuk metrik evaluasi, serta Knowledge Graph Explorer interaktif untuk menelusuri hubungan antar node secara visual. Tahap akhir adalah evaluasi kinerja sistem menggunakan tiga metrik utama: Faithfulness untuk mengukur akurasi terhadap konteks, Answer Relevance untuk menilai relevansi jawaban, dan Context Precision untuk memastikan ketepatan konteks yang diambil.
No other version available