Keterbatasan Claude

Bagian 1 (batasan) + Bagian 16 (Common Failure Modes) dari CLAUDE 101 Master Playbook

Apa yang Tidak Boleh Terlalu Dipercayakan ke Claude

⚠️ [LIMITATION / RISK] — Ini bukan kekurangan Claude secara umum, tapi batasan fundamental AI yang harus selalu diingat.

1. Keputusan Hukum Final

Claude bisa membantu analisis dan drafting, tapi tidak bisa menggantikan penilaian ahli hukum yang bertanggung jawab. Setiap dokumen legal yang dihasilkan Claude harus di-review oleh advokat atau notaris berlisensi sebelum digunakan.

2. Diagnosa dan Keputusan Medis

Claude bisa memberikan informasi umum, tapi tidak bisa menggantikan dokter. Output Claude di domain medis adalah informasi umum, bukan saran klinis.

3. Fakta Real-Time Tanpa Web Search

Pengetahuan internal Claude memiliki cutoff. Tanpa Web Search aktif, informasi mungkin sudah usang — terutama untuk regulasi, harga, dan perkembangan terkini.

4. Detail Spesifik yang Berpotensi Salah

Nomor undang-undang, nama kasus hukum, kutipan pasal, dan detail teknis berpotensi mengandung hallucination. Selalu verifikasi ke sumber primer (JDIH, website resmi regulator).

5. Perhitungan Kompleks yang Kritis

Untuk kalkulasi keuangan, engineering, atau teknis yang kritikal, selalu verifikasi dengan tools matematis atau ahli — jangan andalkan Claude semata.

6. Penilaian Etis dan Moral Final

Claude bisa membantu analisis etis dan mensimulasikan perspektif, tapi keputusan akhir tetap domain manusia.

Tabel Boleh / Tidak Boleh / Verifikasi

Domain	✅ Claude Boleh	❌ Claude Tidak Boleh	🔍 Harus Diverifikasi
Legal	Draft kontrak, analisis risiko, riset regulasi	Keputusan hukum final, tanda tangan hukum	Nomor pasal, yurisprudensi, regulasi terbaru
Medis	Informasi umum, materi edukasi pasien	Diagnosa, dosis obat, treatment plan	Semua informasi klinis
Keuangan	Analisis naratif, proyeksi konseptual	Kalkulasi pajak final, valuasi untuk transaksi	Angka dan perhitungan kritis
Arsitektur	Brief desain, spesifikasi umum, dokumentasi	Kalkulasi struktural, keputusan load-bearing	Compliance keselamatan bangunan
Militer	Sejarah, doktrin publik, penulisan akademis	Planning operasional, analisis intelligence aktual	—

Bagian 16 — Common Failure Modes

16.1 Prompt Terlalu Kabur

Gejala: Output terlalu general, tidak menjawab kebutuhan spesifik, terasa template-ish.

Akar masalah: Claude tidak tahu apa sebenarnya yang dibutuhkan, sehingga memberikan jawaban yang "aman" secara general.

Cara memperbaiki:

Tambahkan: siapa yang bertanya, untuk keperluan apa, situasi spesifik apa
Berikan constraint dan format yang eksplisit
Berikan contoh output yang diinginkan (few-shot)

Prompt perbaikan:

"Jawaban sebelumnya terlalu general. Saya butuh yang lebih spesifik.
Konteks saya: [konteks yang lebih detail].
Apa yang saya maksud dengan [terminologi yang mungkin ambigu]: [penjelasan].
Tolong buat ulang dengan level spesifisitas yang lebih tinggi."

16.2 Konteks Kurang

Gejala: Claude membuat asumsi yang salah, output tidak relevan dengan situasi nyata.

Akar masalah: Informasi yang dibutuhkan Claude untuk memberikan jawaban yang tepat tidak diberikan.

Cara memperbaiki:

Tambahkan background yang relevan
Jelaskan situasi spesifik, bukan hanya topik
Berikan dokumen atau data aktual

Prompt perbaikan:

"Saya tidak memberikan konteks yang cukup. Tambahan konteks:
Background situasinya: [detail baru].
Yang belum saya sebutkan sebelumnya: [informasi tambahan].
Tolong revisi jawaban dengan mempertimbangkan informasi baru ini."

16.3 Konteks Terlalu Banyak

Gejala: Claude tampak kebingungan, menjawab hal yang tidak ditanya, atau fokusnya teralih.

Akar masalah: Terlalu banyak informasi sehingga Claude kesulitan menentukan apa yang paling relevan.

Cara memperbaiki:

Potong informasi yang tidak relevan
Buat instruksi eksplisit tentang apa yang harus difokuskan

Prompt perbaikan:

"Abaikan konteks yang tidak relevan dari pesan sebelumnya.
Fokus HANYA pada: [aspek spesifik].
Pertanyaan yang perlu dijawab adalah: [satu pertanyaan jelas]."

16.4 Tujuan Tidak Jelas

Gejala: Output memenuhi permintaan literal tapi tidak memenuhi kebutuhan aktual.

Akar masalah: Ada perbedaan antara apa yang diminta secara literal dan apa yang sebenarnya dibutuhkan.

Cara memperbaiki:

Jelaskan tujuan akhir, bukan hanya task
Berikan konteks "why" bukan hanya "what"

Prompt perbaikan:

"Output yang diberikan tidak memenuhi apa yang sebenarnya saya butuhkan.
Yang sebenarnya saya ingin capai: [tujuan aktual].
Dalam konteks: [situasi nyata].
Berikan output yang benar-benar menjawab kebutuhan ini."

16.5 Format Output Tidak Dikunci

Gejala: Format output tidak sesuai harapan, sulit langsung digunakan.

Cara memperbaiki:

"Berikan output dalam format PERSIS ini:
[contoh format yang diinginkan, bahkan dengan placeholder jika perlu]
Tidak ada perubahan format."

16.6 Over-Trust pada Output ⚠️

Gejala: Menggunakan output Claude langsung tanpa review. Ini adalah failure mode terbesar.

Akar masalah: Tidak ada proses verifikasi sistematis.

Cara memperbaiki:

Selalu gunakan checklist final review (lihat Quality Control)
Buat habit: "sebelum kirim / sebelum gunakan, saya harus [cek X]"
Untuk high-stakes: selalu ada human expert review

16.7 Salah Pilih Tool

Gejala: Hasil tidak optimal meskipun prompt bagus.

Situasi	Tool yang Salah	Tool yang Benar
Butuh Claude akses file lokal	Chat	Cowork
Butuh akses codebase nyata	Chat	Claude Code
Diskusi cepat dan interaktif	Cowork	Chat
Butuh output di setiap langkah	Cowork	Chat

16.8 Kurang Verifikasi

Gejala: Output terlihat benar tapi belum dicek ke sumber primer.

Cara memperbaiki:

Buat verifikasi sebagai langkah wajib, bukan opsional
Gunakan Web Search untuk klaim faktual
Gunakan human expert review untuk domain high-stakes

16.9 Sycophantic Agreement

Gejala: Claude setuju dengan premis yang salah dalam prompt. Contoh: "Kontrak ini sudah bagus kan?" → Claude mengonfirmasi, padahal ada klausul bermasalah.

Mengapa berbahaya: Claude cenderung mengikuti framing dalam pertanyaan.

Cara mencegah:

JANGAN: "Kontrak ini sudah cukup bagus kan?"
LAKUKAN: "Review kontrak ini. Asumsikan ada masalah yang belum saya temukan.
Cari semua isu tanpa terkecuali."

16.10 Confidence Inflation

Gejala: Claude menyajikan output dengan nada sangat yakin untuk topik yang masih diperdebatkan — terutama interpretasi hukum yang ambigu.

Cara mencegah:

"Dalam menjawab pertanyaan interpretasi hukum ini, identifikasi secara eksplisit:
- Interpretasi mana yang sudah settled (konsensus)
- Interpretasi mana yang masih diperdebatkan
- Area di mana MA belum memberi putusan yang jelas
Gunakan framing 'sebagian ahli berpendapat...' untuk area tidak pasti."

16.11 Recency Bias dalam Referensi

Gejala: Claude memprioritaskan regulasi yang lebih "recent-sounding" dari training data, padahal regulasi lebih lama mungkin masih berlaku atau lebih relevan.

Cara mencegah:

"Verifikasi bahwa regulasi yang kamu sebutkan masih berlaku dan belum dicabut.
Sebutkan juga regulasi yang mengubah atau mencabut regulasi sebelumnya jika relevan."

16.12 Context Window Drift

Gejala: Dalam percakapan panjang (30+ pesan), Claude mulai "melupakan" instruksi dari awal. Format berubah, constraint tidak dipatuhi.

Cara mencegah:

STRATEGI 1 — Anchor Reminder setiap 10-15 pesan:
"[ANCHOR] Ingat: kamu berperan sebagai [role]. Format output: [format]. 
Constraint aktif: [constraint]."

STRATEGI 2 — Start New Chat untuk tugas berbeda.
STRATEGI 3 — Gunakan Projects sebagai anchor permanen.

16.13 The Confident Gap-Filler ⚠️

Gejala: Ketika dokumen yang diupload tidak lengkap, Claude mengisi gap berdasarkan asumsinya — tanpa memberitahu bahwa itu inference.

Sangat berbahaya untuk document review. Claude bisa memberikan "review" yang terdengar komprehensif padahal sebagian berdasarkan asumsi, bukan dokumen aktual.

Cara mencegah:

"Sebelum memulai review: konfirmasi apa yang BENAR-BENAR bisa kamu baca.
Jika ada bagian yang tidak terbaca, SEBUTKAN eksplisit.
JANGAN mengisi gap dengan asumsi."

Ringkasan Strategi Mitigasi

Risiko	Strategi Mitigasi
Hallucination fakta	Web Search + verifikasi ke sumber primer
Output terlalu general	Konteks lebih spesifik + few-shot example
Format salah	Tentukan format output secara eksplisit
Over-trust	Checklist review wajib sebelum digunakan
Konteks drift	Projects + Anchor Reminder di chat panjang
Gap-filler	Instruksi eksplisit: "sebutkan jika tidak terbaca"
Sycophancy	Frame pertanyaan secara adversarial
High-stakes error	Human expert review selalu

Navigasi

Sebelumnya: Kapabilitas Claude
Selanjutnya: Prinsip Inti
Lihat juga: Quality Control System | High-Stakes Verification

Keterbatasan Claude ​

Apa yang Tidak Boleh Terlalu Dipercayakan ke Claude ​

1. Keputusan Hukum Final ​

2. Diagnosa dan Keputusan Medis ​

3. Fakta Real-Time Tanpa Web Search ​

4. Detail Spesifik yang Berpotensi Salah ​

5. Perhitungan Kompleks yang Kritis ​

6. Penilaian Etis dan Moral Final ​

Tabel Boleh / Tidak Boleh / Verifikasi ​

Bagian 16 — Common Failure Modes ​

16.1 Prompt Terlalu Kabur ​

16.2 Konteks Kurang ​

16.3 Konteks Terlalu Banyak ​

16.4 Tujuan Tidak Jelas ​

16.5 Format Output Tidak Dikunci ​

16.6 Over-Trust pada Output ⚠️ ​

16.7 Salah Pilih Tool ​

16.8 Kurang Verifikasi ​

16.9 Sycophantic Agreement ​

16.10 Confidence Inflation ​

16.11 Recency Bias dalam Referensi ​

16.12 Context Window Drift ​

16.13 The Confident Gap-Filler ⚠️ ​

Ringkasan Strategi Mitigasi ​

Navigasi ​

Keterbatasan Claude

Apa yang Tidak Boleh Terlalu Dipercayakan ke Claude

1. Keputusan Hukum Final

2. Diagnosa dan Keputusan Medis

3. Fakta Real-Time Tanpa Web Search

4. Detail Spesifik yang Berpotensi Salah

5. Perhitungan Kompleks yang Kritis

6. Penilaian Etis dan Moral Final

Tabel Boleh / Tidak Boleh / Verifikasi

Bagian 16 — Common Failure Modes

16.1 Prompt Terlalu Kabur

16.2 Konteks Kurang

16.3 Konteks Terlalu Banyak

16.4 Tujuan Tidak Jelas

16.5 Format Output Tidak Dikunci

16.6 Over-Trust pada Output ⚠️

16.7 Salah Pilih Tool

16.8 Kurang Verifikasi

16.9 Sycophantic Agreement

16.10 Confidence Inflation

16.11 Recency Bias dalam Referensi

16.12 Context Window Drift

16.13 The Confident Gap-Filler ⚠️

Ringkasan Strategi Mitigasi

Navigasi