Stasnat RU → ES překlady — showcase

Ukázka automatického dabingu z ruštiny do španělštiny na 15 reálných klipech. Každý řádek nabízí tři verze stejné scény vedle sebe: RU originál zdrojové ruské video (občas s vloženými anglickými frázemi), Náš ES překlad výstup naší pipeline (přeložená a naklonovaná španělská stopa + sesynchronizované rty řečníka), ES nativní nezávislý španělský klip na podobné téma jako kvalitativní reference, jak má znít přirozená španělština (není to obsahově totéž — neporovnávejte slovo za slovem).
Co znamenají údaje u každého klipu

Batch 1 — pouliční / Singapur (5 segmentů)

První dávka pochází z volné kompilace pouličních scén a rozhovorů, většinou natočených v Singapuru. Společné rysy: rychlé střihy, jednotlivé krátké promluvy, žádné vypálené titulky v obraze (probe to ověřil a drahá OCR/vision smyčka se přeskočila).

#SegmentRU originálNáš ES překladES nativní (reference)
1
trh
Scéna z bleších trhů — pouliční prodejce s léky rozloženými na látce v Singapuru. Krátké promluvy, ruční kamera, hluk ulice na pozadí.
Délka: 29,0 s  ·  Mluvená řeč: 98 %
Řečníci: 2  ·  Whisper segmenty: 15 (+ 7 doplnění)
Lip-sync / orig. snímky: 496 / 374
Doba zpracování: 13 min 34 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
2
gangster
Rozhovor v parku s mužem, jehož obličej je v originále z důvodu ochrany soukromí rozmazán. Více střídajících se hlasů (montáž), nedaří se vždy ukázat ústa řečníka v obraze.
Délka: 26,9 s  ·  Mluvená řeč: 100 %
Řečníci: 5  ·  Whisper segmenty: 8 (+ 0 doplnění)
Lip-sync / orig. snímky: 366 / 444
Doba zpracování: 9 min 6 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
3
vypalne
Foto-koláž postav gangsterů / jakuzy s láhvemi a cigaretami. Statické fotografie prostřídané off-komentářem; aktivní mluvčí v obraze je vidět jen sporadicky.
Délka: 20,9 s  ·  Mluvená řeč: 100 %
Řečníci: 4  ·  Whisper segmenty: 5 (+ 0 doplnění)
Lip-sync / orig. snímky: 271 / 359
Doba zpracování: 12 min 0 s
Text ve videu: 2 bloky přeloženy a překresleny do obrazu.
RU originál
Náš ES překlad
ES nativní
4
maid
Skupina přátel sedící kolem piknikového stolu — uvolněná konverzace s překrývajícími se promluvami. Delší kontinuální záběry → vyšší podíl lip-syncovaných snímků.
Délka: 32,0 s  ·  Mluvená řeč: 100 %
Řečníci: 4  ·  Whisper segmenty: 6 (+ 0 doplnění)
Lip-sync / orig. snímky: 598 / 362
Doba zpracování: 14 min 51 s
Text ve videu: 1 blok přeložen a překreslen do obrazu.
RU originál
Náš ES překlad
ES nativní
5
merlion
Panorama Singapuru a fontána Merlion — typický turistický B-roll. Jediný off-mluvčí, žádné záběry obličeje → většina snímků zůstává z originálu, lip-sync se aplikoval minimálně.
Délka: 21,0 s  ·  Mluvená řeč: 100 %
Řečníci: 1  ·  Whisper segmenty: 3 (+ 0 doplnění)
Lip-sync / orig. snímky: 199 / 431
Doba zpracování: 7 min 21 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní

Batch 2 — KLDR / Severní Korea (10 segmentů)

Druhá dávka je vystřižena z reportáží o Severní Koreji — typicky komentář mimo obraz nad ilustračními záběry, doplněný krátkými promluvami obyvatel. Většina klipů má jen jednoho off-mluvčího; lip-sync se aktivuje selektivně tam, kde se v obraze opravdu objeví mluvící tvář.

#SegmentRU originálNáš ES překladES nativní (reference)
1
dron
Letecké drone záběry krajiny a měst — čistý voice-over bez tváře v obraze. Lip-sync proto pracoval jen na pár sekundách, kde se mihla tvář.
Délka: 23,0 s  ·  Mluvená řeč: 100 %
Řečníci: 1  ·  Whisper segmenty: 10 (+ 4 doplnění)
Lip-sync / orig. snímky: 59 / 631
Doba zpracování: 7 min 26 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
2
baleni
Záběr z výrobní linky / balení produktů — komentář nad detailními záběry rukou a strojů. V obraze se objevuje grafický popisek, který se podařilo přeložit a překreslit.
Délka: 25,9 s  ·  Mluvená řeč: 98 %
Řečníci: 1  ·  Whisper segmenty: 18 (+ 6 doplnění)
Lip-sync / orig. snímky: 630 / 150
Doba zpracování: 14 min 43 s
Text ve videu: 1 blok přeložen a překreslen do obrazu.
RU originál
Náš ES překlad
ES nativní
3
vlak
Scéna ve vlaku / na nádraží — krátké výměny mezi cestujícími a komentářem. Méně promluv, většina snímků jsou jízdní záběry beze řeči.
Délka: 18,9 s  ·  Mluvená řeč: 97 %
Řečníci: 2  ·  Whisper segmenty: 3 (+ 0 doplnění)
Lip-sync / orig. snímky: 188 / 382
Doba zpracování: 7 min 4 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
4
stranik
Stráž / hlídač u kontrolního stanoviště — tři rozpoznané hlasy (rychlé střídání reportér / strážný / off-komentář).
Délka: 25,0 s  ·  Mluvená řeč: 100 %
Řečníci: 3  ·  Whisper segmenty: 10 (+ 1 doplnění)
Lip-sync / orig. snímky: 450 / 300
Doba zpracování: 10 min 22 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
5
portrety
Záběry oficiálních portrétů (pravděpodobně propagandistických) s komentářem mimo obraz. Hodně krátkých whisper-segmentů, hodně doplňování pro mix ruštiny a anglických termínů.
Délka: 18,9 s  ·  Mluvená řeč: 97 %
Řečníci: 2  ·  Whisper segmenty: 18 (+ 9 doplnění)
Lip-sync / orig. snímky: 192 / 378
Doba zpracování: 10 min 5 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
6
banka
Scéna v bance / u přepážky — krátká výměna mezi reportérem a zaměstnankyní, ostatní záběry jsou interiér bez mluvčího v obraze.
Délka: 18,9 s  ·  Mluvená řeč: 100 %
Řečníci: 2  ·  Whisper segmenty: 6 (+ 0 doplnění)
Lip-sync / orig. snímky: 232 / 338
Doba zpracování: 7 min 58 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
7
hrusky
Trh s ovocem — prodej hrušek; rychlá výměna více hlasů (reportér + prodejci + okolostojící). Krátký klip s vysokou hustotou promluv.
Délka: 16,0 s  ·  Mluvená řeč: 100 %
Řečníci: 4  ·  Whisper segmenty: 7 (+ 3 doplnění)
Lip-sync / orig. snímky: 308 / 172
Doba zpracování: 7 min 44 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
8
strelnice
Reportáž ze střelnice — víc rozpoznaných hlasů (instruktor / klienti / off-komentář), v ozvuku rány a šum. Pro voice-clone náročnější scéna.
Délka: 25,0 s  ·  Mluvená řeč: 100 %
Řečníci: 5  ·  Whisper segmenty: 6 (+ 2 doplnění)
Lip-sync / orig. snímky: 394 / 356
Doba zpracování: 12 min 25 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
9
prace
Záběry pracovníků v provozu — voice-over jednoho komentátora nad ilustračními záběry. Lip-sync se uplatnil minimálně, drtivá většina snímků je z originálu.
Délka: 25,0 s  ·  Mluvená řeč: 100 %
Řečníci: 1  ·  Whisper segmenty: 4 (+ 0 doplnění)
Lip-sync / orig. snímky: 189 / 561
Doba zpracování: 9 min 18 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní
10
lekarna
Návštěva lékárny — komentář k regálům s léky, krátká výměna se zaměstnancem. Klidnější scéna, jediný off-mluvčí.
Délka: 17,0 s  ·  Mluvená řeč: 97 %
Řečníci: 1  ·  Whisper segmenty: 4 (+ 0 doplnění)
Lip-sync / orig. snímky: 269 / 241
Doba zpracování: 7 min 39 s
Bez vypáleného textu ve videu (probe přeskočen).
RU originál
Náš ES překlad
ES nativní

Poznámky k interpretaci