Metin - Unicode Dönüştürücü

Bu ücretsiz çevrimiçi araçla metni Unicode kaçış dizilerine dönüştürün veya Unicode dizilerini okunabilir metne geri çözün. Uluslararasılaştırma ile çalışan, karakter kodlama sorunlarında hata ayıklayan veya koddaki özel karakterleri işleyen geliştiriciler için mükemmeldir. Emojiler, semboller ve Latin olmayan komut dosyaları dahil olmak üzere tüm Unicode karakterlerini destekler.

Sıkça Sorulan Sorular

Unicode, tüm yazı sistemleri, semboller ve emojilerdeki her karaktere benzersiz bir sayı (kod noktası) atayan evrensel bir karakter kodlama standardıdır. Unicode kaçış dizilerine dönüştürme ('A' için \u0041 gibi), kodda, JSON'da, URL'lerde özel karakterleri temsil etmeniz gerektiğinde veya uluslararası uygulamalarda kodlama sorunlarını ayıklarken kullanışlıdır.

Metninizi giriş alanına yazın veya yapıştırın ve 'Dönüştür'e tıklayın. Araç her karakteri Unicode kaçış dizisi biçimine (BMP karakterleri için \uXXXX veya diğerleri için \u{XXXXXX}) dönüştürecektir. Örneğin, 'Hello' '\u0048\u0065\u006C\u006C\u006F' olur. Bu format JavaScript, JSON ve birçok programlama dilinde yaygın olarak kullanılır.

Evet! Unicode kaçış dizilerini (\u0048 veya \u{1F600} gibi) giriş alanına yapıştırın ve 'Dönüştür'e tıklayın. Araç Unicode dizilerini otomatik olarak algılar ve bunları tekrar okunabilir karakterlere dönüştürür. Bu, kodda hata ayıklarken, kodlanmış JSON verilerini okurken veya uluslararasılaştırılmış içerikle çalışırken faydalıdır.

Unicode, karakterlere sayılar (kod noktaları) atayan karakter kümesi iken, UTF-8 bu sayıların bayt olarak nasıl saklanacağını belirleyen bir kodlamadır. Unicode kaçış dizileri kod noktasını doğrudan temsil ederken (\u0041), UTF-8 kodlaması bu karakterin bellekte nasıl saklandığını temsil eder. Bu araç Unicode kod noktaları ve bunların kaçış dizisi temsilleriyle çalışır.

Evet! Bu Unicode dönüştürücü, emojiler, matematiksel semboller, para birimi işaretleri, Latin olmayan alfabeler (Çince, Arapça, Kiril alfabesi vb.) ve özel karakterler dahil olmak üzere tüm Unicode karakterlerini destekler. Emojiler ve Temel Çok Dilli Düzlem dışındaki karakterler, sırıtan yüz emojisi için \u{1F600} gibi genişletilmiş kaçış dizileriyle temsil edilebilir.

Düzenleyicinizde doğru görüntülenemeyebilecek özel karakterleri kaynak koda eklemeniz gerektiğinde, farklı sistemler arasında uyumluluk sağlarken, kaçan karakterler gerektiren JSON ile çalışırken veya klavyenizde olmayan karakterleri temsil etmeniz gerektiğinde Unicode kaçış dizilerini kullanın. Özellikle uluslararasılaştırma ve farklı dillerdeki kullanıcı girdilerini işlemek için kullanışlıdırlar.

\uXXXX biçimi (4 onaltılık basamak), en yaygın karakterleri içeren U+0000 ila U+FFFF kod noktaları olan Temel Çok Dilli Düzlemi (BMP) kapsayan geleneksel JavaScript/JSON biçimidir. \u{XXXXXX} biçimi (ES6+ JavaScript), emojiler ve nadir karakterler dahil olmak üzere U+10FFFF'ye kadar tüm Unicode kod noktalarını temsil etmek için küme parantezleri ve değişken uzunluklu onaltılık kullanır. U+FFFF ötesindeki karakterler için, eski sistemler vekil çiftleri (iki \uXXXX dizisi) kullanır.

Unicode kod noktası bir karaktere atanan soyut sayıdır (örneğin 'A' için U+0041), UTF-8 ise bu sayının depolama için bayt olarak nasıl kodlandığını gösterir. ASCII karakterleri (U+0000 ila U+007F) 1 UTF-8 baytı, Avrupa karakterleri 2 bayt, Asya karakterleri 3 bayt ve emojiler 4 bayt kullanır. Unicode kaçışları kod noktasını doğrudan gösterirken, UTF-8 dosyalarda ve ağlarda kullanılan gerçek bayt gösterimini gösterir.

Karmaşık emojiler genellikle Sıfır Genişlik Birleştirici (ZWJ) dizileri aracılığıyla birleştirilen birden fazla kod noktası kullanır. Örneğin, aile emojileri kişi + ZWJ + kişi + ZWJ + çocuk emojilerini birleştirir. Cilt tonu değiştiricileri de ekstra kod noktaları ekler. Ayrıca, BMP (U+10000 ila U+10FFFF) dışındaki karakterler UTF-16 vekil çiftleri olarak temsil edilebilir ve eski JSON veya JavaScript ortamlarında iki \uXXXX dizisi olarak gösterilebilir.

Çoğu modern dil Unicode kaçışlarını destekler: JavaScript/JSON (\uXXXX), Python (\uXXXX ve \UXXXXXX), Java (\uXXXX), C/C++ (\uXXXX ve \UXXXXXX), C# (\uXXXX), Ruby (\uXXXX) ve PHP (\u{XXXXXX}). Sözdizimi diller arasında biraz farklılık gösterir - bazıları genişletilmiş aralıklar için büyük harf \U kullanırken, diğerleri küme parantezleri kullanır. Tam biçim için her zaman dilinizin belgelerine bakın, ancak temel Unicode kod noktaları tüm platformlarda aynı kalır.