Araçlara Dön
Metin Uzunluğu Hesaplayıcı
Yerel İşleme
Metin uzunluğunu çeşitli birimlerde hesaplayın: karakterler, baytlar, UTF-8 baytları, UTF-16 kod birimleri, Unicode kod noktaları ve grafem kümeleri. Metnin nasıl farklı şekilde ölçüldüğünü anlayın.
Sıkça Sorulan Sorular
JavaScript'in string.length'i UTF-16 kod birimlerini sayar, bu da emoji ve özel karakterler için yanlış sayımlar verebilir. Unicode kod noktaları gerçek karakter sayısını sayar. Örneğin, "👋" JavaScript'te uzunluk 2'dir ancak 1 kod noktasıdır.
Grafem kümeleri, kullanıcı tarafından algılanan karakterlerdir. Örneğin, "👋🏽" (ten rengiyle el sallayan) 1 grafem kümesidir ancak 4 UTF-16 kod birimi ve 2 Unicode kod noktasıdır. Bu, "görünür karakterlerin" en doğru sayımıdır.
UTF-8 ve UTF-16, aynı karakterler için farklı kodlamalardır. UTF-8 karakter başına 1-4 bayt kullanır (İngilizce için verimli), UTF-16 ise 2 veya 4 bayt kullanır. JavaScript dizeleri dahili olarak UTF-16 kullanır, ancak dosyalar/ağlar genellikle UTF-8 kullanır.
Kullanım durumunuza bağlıdır: Kullanıcı tarafından görülebilir karakter sayısı için grafem kümeleri, dosya/ağ boyutu için UTF-8 baytları, JavaScript dize işlemleri için UTF-16 kod birimleri ve emoji dahil uygun karakter sayımı için Unicode kod noktaları.