Reklamı Kapat
Anasayfa > Makaleler > Altyazı Formatı Kullanıcıları İçin Başlangıç Kılavuzu
Altyazı Formatı Kullanıcıları İçin Başlangıç Kılavuzu
21.11.2022 13:29

Young Hoo Kim / Yazılım Yüksek Mühendisi   |   Therese Lee / Yazılım Yüksek Mühendisi   |    XL8 Inc


Altyazı formatlarına ne kadar aşinasınız? XL8, altyazılı medya için yapay zekâ destekli otomatik çeviride liderlerdendir. XL8'de yazılım mühendisi olmama rağmen, en yaygın kullanılan alt yazı formatı olan SRT dışında alt yazı formatları hakkındaki bilgim sınırlı. Ancak, genellikle aşağıdaki gibi sorular alıyorum:

1. Altyazıları ekranın üst kısmında veya sağ tarafında sunabilir miyim?

2. Altyazı metinlerinin rengini değiştirmek mümkün müdür?

3. MediaCAT, kullandığım belirli bir altyazı formatını destekliyor mu?

Bir yazılım mühendisi olarak, cevaplarımın hangi altyazı formatını kullandığınıza bağlı olarak değişeceğini söyleyebilirim. Daha doğru cevaplar bulmak için ve ayrıca kendim de öğrenmek için, XL8 ve medya ve çeviri endüstrileri tarafından kullanılan altyazı formatları üzerinde biraz çalışma yaptım. Araştırmamın sonucu oldukça şaşırtıcıydı.

Açıkçası, çoğu mühendisin, birçok spesifikasyonun ve önerinin sahada fiili standartlar haline gelmek için birbiriyle rekabet ettiği, teknik olarak parçalanmış dünyasına zaten aşina olduğunu düşünüyorum. Örneğin, A'nın yerine gelen A1 bir şeyi tamamlar, ancak geriye dönük uyumluluktan yoksundur, bu nedenle kullanıcıları için büyük bir kafa karışıklığı yaratır. Ancak bu kaos, yazılım mühendisleri için “olağandır”, bu yüzden durumu kabullenip onlarla birlikte yaşarlar.

Ancak altyazı formatları söz konusu olduğunda hepsini bir kerede anlamak daha zordu, çünkü birçoğu standart olma amacı hedeflenmeden yaratılmıştı; ve genel olarak, yeni bir formatın neden önerildiğinin veya hangi belirli özelliklerin geliştirildiğinin arkasındaki nedeni anlamak zordu. Bazı formatların herhangi bir spesifikasyon (teknik kurallar) belgesi yoktur. En önemlisi, bu formatların çoğu yalnızca kendi özel uygulamalarını destekler ve diğer formatlarla rekabet etme niyeti yoktur.

Bu araştırmaya başlamadan önce, birçok wiki sayfasında dolaşmak zorunda kalacağımı tahmin etmiştim, ancak sonuçta birçok formatın wiki sayfası bulunmadığı ortaya çıktı. Bu yazıda, araştırmamın en dikkate değer bulgularını vurgulayacağım. Daha önce de belirttiğim gibi, bu çorak alandan anlamlı bilgiler toplamak için elimden geleni yaptım.

SubRip (.srt)

SRT, wiki sayfası olan formatlardan biridir. 2000 yılında Delphi kullanılarak piyasaya sürülen ücretsiz bir Windows yazılımı olan “SubRip” için geliştirilmiş olması nedeniyle wiki sayfasında SubRip olarak adlandırılmıştır. SRT, SubRip Text ifadesinin kısaltmasıdır. Formatın wiki sayfasında, adını nasıl aldığını açıklanmış. 

SRT dosyalarının içeriğini en az bir kez görmüş olabilirsiniz.

SRT dosyası aşağıdaki bileşenlerden oluşur:

  • sırayla altyazı karesinin numarası,
  • altyazı karesinin ne zaman görünmesi gerektiğine ilişkin başlangıç ve bitiş zaman kodları,
  • altyazı metni,
  • altyazının sonunu ve yeni bir altyazı dizisinin başlangıcını gösteren boş bir satır.

Şimdi düşüncemizi şu sorulardan birine yönlendirelim: Metnin rengini değiştirmek mümkün müdür? SubRip bu özelliği açıkça ele almadığından, metin rengini değiştirme yeteneği, altyazıları sunan medya oynatıcıya bağlıdır. Oynatıcı aygıtların çoğu, koyu yazı için <b>, italik için <i>, altı çizili için <u> ve yazı tipi rengi için <font color=”#code”> gibi birkaç html stili etiketi destekler.

Resmi olmadığı için (“resmi” bir belge yoktur), sorunun doğru cevabı “Medya yürütücünüze bağlıdır. Kullanmak istediğiniz oynatıcı aygıt üzerinde test etmeli ve rengi doğru gösterip göstermediğini belirlemelisiniz.” En kötü durumda, izleyicilere ham html etiketini gösterebilir.

Peki ya metnin konumu? Ekrandaki konumunu ayarlayabilir miyiz? Yine, gayri resmi olarak ASS kullanarak mümkündür ve bu yetenek, kullanılan belirli medya oynatıcılara bağlıdır. Bu resmi olmayan etiketleri desteklemeyen bir oynatıcı aygıtın üzerinde "{\an8}" gibi etiketlere sahip altyazılar bile gördüm.

TTML (.dfxp, .ttml)

SRT dahil birçok altyazı formatı belirli uygulamalar içindir, bu nedenle standart ve spesifikasyon yoktur. Bu yüzden “gayri resmi” terimi biraz rahatsız edici. Ancak, aşağıda açıklanan TTML altyazıları, belirli bir dizi spesifikasyon içerdikleri için çoğu altyazı formatından farklıdır.

Daha önce DFXP olarak adlandırılan TTML (Timed Text Markup Language), W3C standardına sahiptir ve mühendislerin aşina olduğu bir biçimlendirme dili olan XML kullanır.

Bu format, altyazıların stilini ve hizalamasını şart koşar. Altyazı metninin rengini ve hizalamasını aşağıdaki resimdeki gibi birçok farklı şekilde değiştirebilir.

XML biraz uzun olsa da, birçok medya oynatıcı bu formatı desteklemektedir. Ayrıca, en yaygın kullanılan altyazı formatlarından biridir. TTML, gelişmiş özelliklere ihtiyaç duyulduğunda en iyi seçeneklerden biridir.

WebVTT (.vtt)

2010'da, HTML5 tartışmaları aktif olarak sürerken, alt yazı standardını çevreleyen tartışmalar da alevlendi. Tartışmalardan biri, <video> öğeleri için <track> etiketiyle hangi altyazı standardının kullanılacağıydı. W3C, SubRip tarafından SRT'yi ve XML standardını kullanan TTML'yi değerlendirdi, ancak sonuçta ikisi de seçilmedi. WebVTT adı verilen yeni altyazı formatı SRT'den esinlenmiştir. WebVTT'nin spesifikasyonu henüz başlangıç aşamasında olmasına rağmen, tarayıcıların büyük çoğunluğu bu formatı desteklemektedir.

WebVTT, SRT temelli olduğu için çok daha tanıdık. Ek olarak, bir stil veya hizalama standardını destekler.

Ayrıca kodlamayı UTF8 olarak belirten birkaç formattan biridir. Diğer altyazı biçimlerinin çoğu, kodlamayı belirtmez; bu nedenle, dosyanın ayrıştırılması gerektiğinde karakter kümesi tespiti yapılmalıdır.

SCC (.scc)

SCC, Adobe Premiere veya Final Cut Pro için yaygın olarak kullanılan Scenarist Closed Caption ifadesinin kısaltmasıdır. Altyazı dünyasını keşfediyorsanız, Closed Caption’ı biliyor olabilirsiniz. Closed Caption, belleğe yazılan (burned-in) bir altyazı değildir; başka bir deyişle, dosya formatındaki ham altyazı olduğu gibidir. Henüz belleğe yazılmış olmadığı için ekranda gösterilip gösterilmeme seçeneğine sahiptir. Belleğe yazdırılan altyazılar Open Caption, Burned-in Caption veya Baked on Caption olarak adlandırılırlar.

SCC formatı, metin şekillendirme ve hizalama için çeşitli özelliklere sahiptir. Ancak, metni 2 bayt onaltılık (hexadecimal) olarak ifade eder ve çok sınırlı bir karakter kümesini destekler. Sonuç olarak, Korece, Çince, Japonca vb. genel Latin alfabesini kullanmayan dillerden oluşan birçok altyazı bu formatı kullanamaz. Ayrıca, kare hızı (29.97) ve bir satırdaki metnin uzunluğu (37) ile ilgili sınırlamalara sahiptir.

Spruce STL (.stl)

STL, Spruce Technologies Inc. tarafından kendi uygulamaları için geliştirilen Spruce Subtitle File ifadesinin kısaltmasıdır; DVD Studio Pro. STL yaygın olarak kullanılmamaktadır ancak aşağıda anlatılacak olan EBU STL ile olan ilişkisi nedeniyle değinilmesi gerekmektedir.

EBU STL (.stl)

STL'nin bu sürümü Avrupa Yayıncılık Birliği (EBU) tarafından geliştirilmiştir ve Spruce Technologies Inc. tarafından sağlanan STL ile aynı dosya uzantısını kullanır. Ne yazık ki, altyazı oluşturucuların bu formatın EBU STL mi yoksa daha fazla iş yaratan Spruce STL mi olduğunu doğrulamaları gerekir. Şimdiye kadar açıklanan ve düz metin (plain text) kullanan diğer formatların aksine, EBU formatı ikili (binary) veriden oluşur. Bu nedenle, genel bir metin editörü ile okunamaz.

PAC (.pac)

PAC de Screen Subtitling Systems tarafından geliştirilen ikili bir formattır. Metin stilini ve hizalamayı destekler, ancak spesifikasyonu bulmak gerçekten zor.

XIF (.xif)

XIF, XML tabanlı altyazı formatıdır ve aynı zamanda spesifikasyonları olmayan dosya formatlarından biridir.

SAMI (.smi)

SAMI, HTML formuna benzeyen Synchronized Accessible Media Interchange ifadesinin kısaltmasıdır. Başlangıçta Microsoft, medya oynatıcılar için erişilebilirliği artırmak için bu formatı geliştirdi ve Koreliler tarafından geliştirilen medya oynatıcı SASAMI 2K bunu destekledi. Oynatma aygıtı Kore'de olağanüstü bir popülariteye sahip olduğundan, SMI formatı sanki standartmış gibi ülkedeki en popüler format haline geldi.

Adı SAMI veya SMI'ye çok benzediği için birçok kişi dosya biçimini SASAMI (Specially Advanced Synchronized Accessible Media Interchange) için geliştirilmiş olanla karıştırıyor. Ancak Microsoft, herhangi bir güncelleme veya ek destek olmadan, formatı olduğu gibi bıraktı. Ayrıca, Windows 10'un Movie &TV uygulaması SMI biçimini desteklemiyor.

SMI, şekillendirme ve hizalama özelliklerine sahiptir. Ancak, uyumluluk için başkalarını kullanmak daha iyi olabilir çünkü birçok medya oynatıcı bu formatı desteklemez.

Sonuç

Bu araştırma sırasında, birçok format için spesifikasyonlar bulmak ve bir formatın hangi amaçla geliştirildiğini anlamak zordu. WHATWG sayfasında çok fazla “Bu format için bir spesifikasyon bulunamadı” yazıyor. Bana göre bunun nedeni, çoğu formatın belirli bir uygulama için geliştirilmiş olması ve TTML ve VTT dışında bu formatların standart olması için hiçbir çaba gösterilmemesi gibi görünüyor. Ancak, bu sadece bir tahmin.

XL8 yukarıda bahsedilen formatların çoğunu desteklese de, çoğu müşteri SRT, TTML ve VTT formatlarını kullanır. Daha gelişmiş özellikler gerekiyorsa TTML veya VTT kullanabilirsiniz. Ancak, eski yapıları nedeniyle diğer formatlara ihtiyaç olduğunu düşünmüyorum. Çok sayıda mühendis, yıl 2022 olmasına rağmen eski sistemleri desteklemek için bu devrini tamamlamış formatları kullanmaktan sorunlar yaşıyor! Kahramanca çabaları ve tüm sıkı çalışmaları için onlara şapka çıkarıyorum.

En Çok Okunanlar
Dergi