Keterbatasan Claude
Bagian 1 (batasan) + Bagian 16 (Common Failure Modes) dari CLAUDE 101 Master Playbook
Apa yang Tidak Boleh Terlalu Dipercayakan ke Claude
⚠️
[LIMITATION / RISK]— Ini bukan kekurangan Claude secara umum, tapi batasan fundamental AI yang harus selalu diingat.
1. Keputusan Hukum Final
Claude bisa membantu analisis dan drafting, tapi tidak bisa menggantikan penilaian ahli hukum yang bertanggung jawab. Setiap dokumen legal yang dihasilkan Claude harus di-review oleh advokat atau notaris berlisensi sebelum digunakan.
2. Diagnosa dan Keputusan Medis
Claude bisa memberikan informasi umum, tapi tidak bisa menggantikan dokter. Output Claude di domain medis adalah informasi umum, bukan saran klinis.
3. Fakta Real-Time Tanpa Web Search
Pengetahuan internal Claude memiliki cutoff. Tanpa Web Search aktif, informasi mungkin sudah usang — terutama untuk regulasi, harga, dan perkembangan terkini.
4. Detail Spesifik yang Berpotensi Salah
Nomor undang-undang, nama kasus hukum, kutipan pasal, dan detail teknis berpotensi mengandung hallucination. Selalu verifikasi ke sumber primer (JDIH, website resmi regulator).
5. Perhitungan Kompleks yang Kritis
Untuk kalkulasi keuangan, engineering, atau teknis yang kritikal, selalu verifikasi dengan tools matematis atau ahli — jangan andalkan Claude semata.
6. Penilaian Etis dan Moral Final
Claude bisa membantu analisis etis dan mensimulasikan perspektif, tapi keputusan akhir tetap domain manusia.
Tabel Boleh / Tidak Boleh / Verifikasi
| Domain | ✅ Claude Boleh | ❌ Claude Tidak Boleh | 🔍 Harus Diverifikasi |
|---|---|---|---|
| Legal | Draft kontrak, analisis risiko, riset regulasi | Keputusan hukum final, tanda tangan hukum | Nomor pasal, yurisprudensi, regulasi terbaru |
| Medis | Informasi umum, materi edukasi pasien | Diagnosa, dosis obat, treatment plan | Semua informasi klinis |
| Keuangan | Analisis naratif, proyeksi konseptual | Kalkulasi pajak final, valuasi untuk transaksi | Angka dan perhitungan kritis |
| Arsitektur | Brief desain, spesifikasi umum, dokumentasi | Kalkulasi struktural, keputusan load-bearing | Compliance keselamatan bangunan |
| Militer | Sejarah, doktrin publik, penulisan akademis | Planning operasional, analisis intelligence aktual | — |
Bagian 16 — Common Failure Modes
16.1 Prompt Terlalu Kabur
Gejala: Output terlalu general, tidak menjawab kebutuhan spesifik, terasa template-ish.
Akar masalah: Claude tidak tahu apa sebenarnya yang dibutuhkan, sehingga memberikan jawaban yang "aman" secara general.
Cara memperbaiki:
- Tambahkan: siapa yang bertanya, untuk keperluan apa, situasi spesifik apa
- Berikan constraint dan format yang eksplisit
- Berikan contoh output yang diinginkan (few-shot)
Prompt perbaikan:
"Jawaban sebelumnya terlalu general. Saya butuh yang lebih spesifik.
Konteks saya: [konteks yang lebih detail].
Apa yang saya maksud dengan [terminologi yang mungkin ambigu]: [penjelasan].
Tolong buat ulang dengan level spesifisitas yang lebih tinggi."16.2 Konteks Kurang
Gejala: Claude membuat asumsi yang salah, output tidak relevan dengan situasi nyata.
Akar masalah: Informasi yang dibutuhkan Claude untuk memberikan jawaban yang tepat tidak diberikan.
Cara memperbaiki:
- Tambahkan background yang relevan
- Jelaskan situasi spesifik, bukan hanya topik
- Berikan dokumen atau data aktual
Prompt perbaikan:
"Saya tidak memberikan konteks yang cukup. Tambahan konteks:
Background situasinya: [detail baru].
Yang belum saya sebutkan sebelumnya: [informasi tambahan].
Tolong revisi jawaban dengan mempertimbangkan informasi baru ini."16.3 Konteks Terlalu Banyak
Gejala: Claude tampak kebingungan, menjawab hal yang tidak ditanya, atau fokusnya teralih.
Akar masalah: Terlalu banyak informasi sehingga Claude kesulitan menentukan apa yang paling relevan.
Cara memperbaiki:
- Potong informasi yang tidak relevan
- Buat instruksi eksplisit tentang apa yang harus difokuskan
Prompt perbaikan:
"Abaikan konteks yang tidak relevan dari pesan sebelumnya.
Fokus HANYA pada: [aspek spesifik].
Pertanyaan yang perlu dijawab adalah: [satu pertanyaan jelas]."16.4 Tujuan Tidak Jelas
Gejala: Output memenuhi permintaan literal tapi tidak memenuhi kebutuhan aktual.
Akar masalah: Ada perbedaan antara apa yang diminta secara literal dan apa yang sebenarnya dibutuhkan.
Cara memperbaiki:
- Jelaskan tujuan akhir, bukan hanya task
- Berikan konteks "why" bukan hanya "what"
Prompt perbaikan:
"Output yang diberikan tidak memenuhi apa yang sebenarnya saya butuhkan.
Yang sebenarnya saya ingin capai: [tujuan aktual].
Dalam konteks: [situasi nyata].
Berikan output yang benar-benar menjawab kebutuhan ini."16.5 Format Output Tidak Dikunci
Gejala: Format output tidak sesuai harapan, sulit langsung digunakan.
Cara memperbaiki:
"Berikan output dalam format PERSIS ini:
[contoh format yang diinginkan, bahkan dengan placeholder jika perlu]
Tidak ada perubahan format."16.6 Over-Trust pada Output ⚠️
Gejala: Menggunakan output Claude langsung tanpa review. Ini adalah failure mode terbesar.
Akar masalah: Tidak ada proses verifikasi sistematis.
Cara memperbaiki:
- Selalu gunakan checklist final review (lihat Quality Control)
- Buat habit: "sebelum kirim / sebelum gunakan, saya harus [cek X]"
- Untuk high-stakes: selalu ada human expert review
16.7 Salah Pilih Tool
Gejala: Hasil tidak optimal meskipun prompt bagus.
| Situasi | Tool yang Salah | Tool yang Benar |
|---|---|---|
| Butuh Claude akses file lokal | Chat | Cowork |
| Butuh akses codebase nyata | Chat | Claude Code |
| Diskusi cepat dan interaktif | Cowork | Chat |
| Butuh output di setiap langkah | Cowork | Chat |
16.8 Kurang Verifikasi
Gejala: Output terlihat benar tapi belum dicek ke sumber primer.
Cara memperbaiki:
- Buat verifikasi sebagai langkah wajib, bukan opsional
- Gunakan Web Search untuk klaim faktual
- Gunakan human expert review untuk domain high-stakes
16.9 Sycophantic Agreement
Gejala: Claude setuju dengan premis yang salah dalam prompt. Contoh: "Kontrak ini sudah bagus kan?" → Claude mengonfirmasi, padahal ada klausul bermasalah.
Mengapa berbahaya: Claude cenderung mengikuti framing dalam pertanyaan.
Cara mencegah:
JANGAN: "Kontrak ini sudah cukup bagus kan?"
LAKUKAN: "Review kontrak ini. Asumsikan ada masalah yang belum saya temukan.
Cari semua isu tanpa terkecuali."16.10 Confidence Inflation
Gejala: Claude menyajikan output dengan nada sangat yakin untuk topik yang masih diperdebatkan — terutama interpretasi hukum yang ambigu.
Cara mencegah:
"Dalam menjawab pertanyaan interpretasi hukum ini, identifikasi secara eksplisit:
- Interpretasi mana yang sudah settled (konsensus)
- Interpretasi mana yang masih diperdebatkan
- Area di mana MA belum memberi putusan yang jelas
Gunakan framing 'sebagian ahli berpendapat...' untuk area tidak pasti."16.11 Recency Bias dalam Referensi
Gejala: Claude memprioritaskan regulasi yang lebih "recent-sounding" dari training data, padahal regulasi lebih lama mungkin masih berlaku atau lebih relevan.
Cara mencegah:
"Verifikasi bahwa regulasi yang kamu sebutkan masih berlaku dan belum dicabut.
Sebutkan juga regulasi yang mengubah atau mencabut regulasi sebelumnya jika relevan."16.12 Context Window Drift
Gejala: Dalam percakapan panjang (30+ pesan), Claude mulai "melupakan" instruksi dari awal. Format berubah, constraint tidak dipatuhi.
Cara mencegah:
STRATEGI 1 — Anchor Reminder setiap 10-15 pesan:
"[ANCHOR] Ingat: kamu berperan sebagai [role]. Format output: [format].
Constraint aktif: [constraint]."
STRATEGI 2 — Start New Chat untuk tugas berbeda.
STRATEGI 3 — Gunakan Projects sebagai anchor permanen.16.13 The Confident Gap-Filler ⚠️
Gejala: Ketika dokumen yang diupload tidak lengkap, Claude mengisi gap berdasarkan asumsinya — tanpa memberitahu bahwa itu inference.
Sangat berbahaya untuk document review. Claude bisa memberikan "review" yang terdengar komprehensif padahal sebagian berdasarkan asumsi, bukan dokumen aktual.
Cara mencegah:
"Sebelum memulai review: konfirmasi apa yang BENAR-BENAR bisa kamu baca.
Jika ada bagian yang tidak terbaca, SEBUTKAN eksplisit.
JANGAN mengisi gap dengan asumsi."Ringkasan Strategi Mitigasi
| Risiko | Strategi Mitigasi |
|---|---|
| Hallucination fakta | Web Search + verifikasi ke sumber primer |
| Output terlalu general | Konteks lebih spesifik + few-shot example |
| Format salah | Tentukan format output secara eksplisit |
| Over-trust | Checklist review wajib sebelum digunakan |
| Konteks drift | Projects + Anchor Reminder di chat panjang |
| Gap-filler | Instruksi eksplisit: "sebutkan jika tidak terbaca" |
| Sycophancy | Frame pertanyaan secara adversarial |
| High-stakes error | Human expert review selalu |
Navigasi
- Sebelumnya: Kapabilitas Claude
- Selanjutnya: Prinsip Inti
- Lihat juga: Quality Control System | High-Stakes Verification