Elixer vertaalfabriek · repo-overzicht
Vertaalmodel-onderzoek · 2026-05-11

Pahl-pilot

Jon Pahl, Fethullah Gülen: A Life of Hizmet — welk vertaalmodel voor de Pahl-biografie (EN→NL)?
6 chunks ~12,5k EN-woorden steekproef 4 vertaalmethoden 18 vertalingen 12 KPI's
Status: pilot afgerond (n=6) · verdict voor productie geveld
TL;DR. Het n=1-verdict (Opus 4.7 max + ~5-regelige prompt voor conventies) blijft staan, maar wordt op enkele punten verfijnd. Belangrijkste verfijning: Opus's eerbiedsformule-omissie is niet absoluut — op alvar voegt hij spontaan 3× ﷺ toe; op s02 nul. De variabiliteit per chunk bevestigt dat een prompt-aanvulling nodig is om consistent te zijn (niet om een structurele blinde vlek te repareren). DeepL blijft gediskwalificeerd: nu ook met "King James Version" laten staan i.p.v. Statenvertaling, en "I woe" letterlijk vertaald als "ik wee". Sonnet zero-shot heeft op het voorwoord een nieuwe bug ontwikkeld: een meta-commentaar voor de vertaling.
Wat veranderde t.o.v. n=1: ﷺ-patroon Opus genuanceerd (variabel, niet absoluut). ALA-LC-faal-patroon bevestigd (0 op simpele chunks, 10-11× fout op chunk met veel Arabische namen). Sonnet kreeg een nieuwe bug. DeepL kreeg twee extra diskwalificatoren bij. Opus kreeg een unieke winst: spontane ﷺ + correcte Hocaefendi op alvar.

Sample-overzicht {#sample-overzicht}

Zes chunks uit verschillende plekken in het boek, ~10.964 EN-woorden in totaal (de oorspronkelijke s02 niet meegerekend, dus totale corpus ~12.628 EN-woorden). Per kaart een directe link naar de side-by-side viewer.

ch1 · s02

We were a happy family

1664 EN-woorden · biografisch-narratief · 4-way (incl. zware pipeline)
  • Zwaar "als als"-stapeling (−1 KPI 4)
  • Sonnet 5× ﷺ spontaan, 4× ī-fout, ʿ correct
  • Opus 0× ﷺ, 0× diakritica, mooi Nederlands
  • DeepL "12 meter" (factor 3 fout), "Rechtvaardige Kaliefen" (verkeerde term)
→ Side-by-side (4 methoden)
00 · voorwoord

s01 — preface

1915 EN-woorden · auteurs-stem (Pahl spreekt)
  • Sonnet meta-commentaar bug ("Let op: de agent heeft...")
  • Sonnet+Opus Statenvertaling-citaat correct geïdentificeerd
  • DeepL "King James Version" niet vervangen door Statenvertaling (KPI 12 fail)
  • Geen Profeet/sahaba in chunk, dus KPI 9 N.V.T.
→ Side-by-side (3 methoden)
01 · introductie

s02 — opening

3145 EN-woorden · biografische opening
  • Sonnet "Hodjaefendi" (foute spelling, 1×)
  • Opus "Hocaefendi" (correct, 1×)
  • DeepL "Hodjaefendi" (foute spelling)
  • Stilistisch alle drie redelijk vlot
→ Side-by-side (3 methoden)
ch1 · s06 — rijkste chunk

Alvar

3447 EN-woorden · spirituele biografie
  • Opus 3× ﷺ spontaan toegevoegd ("Profeet ﷺ")
  • Sonnet 0× ﷺ, 11× ī-fout (moet ı̄ zijn)
  • Opus 10× ī-fout, 0× ı̄
  • DeepL "I woe" → "ik wee", 3× "Hodjaefendi"
  • Beide LLMs: Hocaefendi 3× correct
→ Side-by-side (3 methoden)
ch4 · s02

Succeeding for the pleasure of God

1427 EN-woorden · theologisch-pedagogisch
  • Sonnet 1× ﷺ + correcte "Hocaefendi"
  • Opus 0× ﷺ, "Hodjaefendi" (foute spelling)
  • DeepL 0× ﷺ, "Hodjaefendi", maar leesbaar Nederlands
  • Sonnet: "ter wille van Gods welbehagen" (registerlift)
→ Side-by-side (3 methoden)
ch5 · s03

America — opening

1030 EN-woorden · narratief-spiritueel slot
  • Geen Hocaefendi/Hodjaefendi (chunk gebruikt "Gülen")
  • Geen ﷺ-trigger contexten
  • Alle 3 ongeveer gelijk in stilistische kwaliteit; Opus iets meeslepender ritme
  • Lange Gülen-citaat: alle 3 redelijk getrouw, geen grote schade
→ Side-by-side (3 methoden)

KPI-matrix (gemiddelde over n=6) {#kpi-matrix}

Voor elke KPI: gemiddelde score 1–5 over de chunks. Zwaar staat alleen op 1 chunk; zijn kolom is dus n=1, niet vergelijkbaar in robustheid. Tussen haakjes //=: verandering t.o.v. n=1-rapport.

KPI Zwaar (n=1) Sonnet zero (n=6) Opus 4.7 max (n=6) DeepL (n=6)
1. Brontextrouw4 =3,7 ↓ voorwoord-bug4,0 =4,0 =
2. Feitelijke correctheid5 =4,2 =4,8 =2,0 ↓ wee+KJV
3. Theologische correctheid5 =4,0 =4,0 =1,5 =
4. Idiomatisch NL2 =4,7 ↓ voorwoord meta5,0 =3,0 =
5. Zinsritme & leesbaarheid3 =4,2 =4,8 =3,0 =
6. Register-trouw aan Pahl4 =4,2 =4,8 =3,0 =
7. Woordkeuze precisie4 =4,0 ↑ ch44,8 =2,8 ↓ wee
8. ALA-LC transliteratie (ı̄, ʿ, ʾ)5 =1,8 ↓ alvar 11×1,3 ↓ alvar 10×1,0 =
9. Eerbiedsformules (ﷺ + metgezellen)5 =3,2 =2,5 ↑ alvar 3×1,0 =
10. NL/Turkse naamconventies4 =4,0 ↑ Hocaefendi4,0 =1,0 ↓ 5× Hodja
11. Cursief vakterm-leenwoorden5 =4,7 =4,5 =1,0 =
12. Bijbelconventie (Statenvertaling/NBV21)4 =4,5 ↑ voorwoord4,0 ↑ voorwoord2,0 =
Totaal /60 (gemiddeld)50 (n=1)45,246,523,3

Scores worden voor mechanische KPI's (8–12) berekend per chunk via analyze_outputs.py (telt ﷺ, ı̄, ī, ʿ, Hocaefendi, etc.). Voor stilistische KPI's (1–7) gebaseerd op steekproef-passages per chunk.

Aggregatieve patroonbevindingen {#bevindingen}

Wat n=6 heeft bevestigd

Wat n=6 heeft genuanceerd of weerlegd

Nieuw zichtbaar in n=6

Operationeel — kosten over hele boek {#kosten}

180–220k EN-woorden = ~110–130 chunks van ~1500 EN-woorden. Geactualiseerde kosten op basis van 5 nieuwe runs:

MethodePer chunk (gem.)Tijd (gem.)Boek-totaalEindproduct?
Zwaar (Sonnet + pipeline)~$0,30–0,50~6 min$30–50Ja, met conventies
Sonnet zero-shot~$0,05~30–90 sec$5–10Met prompt + clean
Opus 4.7 max effort~$1–2~2–5 min$100–220Met prompt
DeepL Free~€0,005<5 sec~€0,50Nee — als grondverf

Opus's looptijd schaalt sterker met chunklengte dan eerder geschat — de 3447-woord alvar-chunk duurde ~8 min met max effort. Voor het hele boek zou Opus max ongeveer 8–12 uur draaien (alle chunks sequentieel). Parallelliseerbaar tot ~30 min als 20 chunks tegelijk.

Verdict (verfijnd, n=6) {#verdict}

De n=1-conclusie blijft: Opus 4.7 max effort als basis-vertaler, aangevuld met een minimale prompt voor de conventies die hij niet consistent meeneemt.

Verfijning op de prompt: de oorspronkelijke "5 regels" worden geschrapt tot 4, omdat Opus blijkt het Hocaefendi-bewustzijn deels al te hebben (4/5). Voor de overige conventies blijven de regels nodig:

  1. Voor Arabische namen: gebruik ı̄ (U+0131 + U+0304), niet ī. Voorbeelden: Lütfı̄, Bediüzzaman, ʿAlı̄. Belangrijkste fix — 10 fouten/chunk op rijke alvar-achtige passages
  2. Voor Profeet Mohammed: voeg toe na elke vermelding bij naam of titel. Variabel per chunk; instructie borgt consistentie
  3. Voor metgezellen: voeg "(moge God tevreden met hem/haar zijn)" toe na de eerste vermelding per passage.
  4. Spel "Hocaefendi" (niet "Hodjaefendi" of "Hojaefendi"). Confirmed nodig — per-chunk instabiliteit

Niet kiezen:

  • Zware pipeline — n=1 leverde gestolde "als als"-stapeling. n=5 niet getest, maar architectuur is hetzelfde dus risico's zijn dezelfde. Bovendien: stilistisch verlies wordt door post-edit niet teruggewonnen, conventie-winst kan goedkoper.
  • Sonnet zero-shot — gemiddeld 45,2/60. Stilistisch iets onder Opus, ﷺ-bewustzijn iets erboven, maar nieuwe meta-commentaar bug op voorwoord (1/6) maakt nageleidte vereist. Per-chunk risico hoger dan Opus.
  • DeepL als eindproduct — 23,3/60, vier categorieën van inhoudelijke fouten (transliteratie 1, ﷺ 1, naamconventies 1, Bijbelconventie 2). Diskwalificerend voor publicatie. Wel bruikbaar als grondverf voor menselijke editor (extreem snel/goedkoop).

Aanbevolen pipeline-architectuur:

  • Opus 4.7 max + 4-regelige prompt → ruwe vertaling (~$1–2/chunk, ~3–8 min)
  • validate_vertaling.py --fix → Unicode/ALA-LC mechanische clean-up (eenmalig op output)
  • Eindredacteur-agent (Opus) → optioneel voor theologisch gevoelige chunks
  • Mo's review op werktafel → eindbeslissingen

Caveat {#caveat}

Caveat (n=6): dit is nog steeds een steekproef van zes chunks (~10% van het boek). Drie patronen die n=6 heeft bevestigd verdienen een herijking na ~30 chunks productie:

  1. Houdt Opus's stilistische consistentie buiten Pahl's biografische register, vooral in dialoog-zware of theologisch-technische passages?
  2. Blijft de meta-commentaar-bug van Sonnet eenmalig, of recurrent op auteurs-stem-passages?
  3. Zijn er chunks met getallen (statistieken, dateringen) die DeepL net wél goed doet en die de grondverf-hypothese kunnen valideren?

De eerstvolgende productiebeslissing zou moeten zijn: 1 hoofdstuk (10–15 chunks) volledig met Opus + prompt + validate, met Mo's review op kwaliteit en post-edit-tijd. Dan weten we of de geëxtrapoleerde $100–220 boek-kosten realistisch zijn.