भारतीय मुद्रलिपियों के लिये विधिपत्र | ||
---|---|---|
पिछला | अगला |
अब आप फ़ाइल नामों में कोई भी यूनीकोड अक्षर रख सकते हैं। किसी भी कर्नल या फ़ाइल कार्यसहायक में किसी बदलाव की ज़रूरत नहीं है। ऐसा कैसे? क्योंकि कर्नल के हिसाब से फ़ाइल के नाम में बस नल बाइट नहीं होनी चाहिये, और '/' का इस्तेमाल निर्देशिकाओं में फ़र्क करने के लिये होता है। यू॰टी॰ऍफ़॰-८ कूटबन्धन का इस्तेमाल करने पर बे-ऍस्की अक्षर कभी भी नल बाइट या स्लैश के तौर पर कूटबन्धित नहीं होंगे । बस इतना है कि फ़ाइल व निर्देशिका नामों में जितने अक्षर हैं उससे ज़्यादा बाइट होंगी । उ॰ अगर किसी फ़ाइल नाम में ५ यूनानी अक्षर हैं तो कर्नल को लगेगा कि वह १० बाइट का फ़ाइल नाम है। कर्नल न तो यह जानता है कि यह बाइट बतौर ग्रीक प्रदर्शित होंगी, न ही उसे यह जानने की ज़रूरत है।
लैनक्स पर जब तक आपकी फ़ाइलें है, यही मूलभूत नियम है । यदि कोई फ़ाइल प्रणाली दूसरी प्रचालन प्रणालियों से इस्तेमाल होती हैं तो फ़ाइल नामों को यू॰टी॰ऍफ़॰-८ से या यू॰टी॰ऍफ़॰-८ में परिवर्तित करने के लिये माउण्ट विकल्प हैं :
"vfat" फ़ाइल प्रणालियों में "utf8" माउण्ट विकल्प है। देखिये /usr/src/linux/Documentation/filesystems/vfat.txtफ़ाइल । यदि आप "iocharset" माउण्ट विकल्प डिफ़ॉल्ट (जो कि "iso8859-1" है) से अलग देते हैं, तो "utf8" के साथ और उसके बिना व्यवहार कुछ गड़बड़ है। इसलिये मैं "iocharset" माउण्ट विकल्प का प्रयोग न करने की सलाह देता हूँ ।
"msdos", "umsdos" फ़ाइल प्रलाणियों में भी यही माउण्ट विकल्प हैं, लेकिन उनका कोई असर नज़र आता नहीं दिखता ।
"iso9660" फ़ाइल प्रणाली में "utf8" माउण्ट विकल्प है । देखिये /usr/src/linux/Documentation/filesystems/isofs.txt फ़ाइल ।
लैनक्स २.२.x कर्नलों के बाद से "ntfs" फ़ाइल प्रलाणी में "utf8" माउण्ट विकल्प है । देखिये /usr/src/linux/Documentation/filesystems/ntfs.txt फ़ाइल ।
अन्य फ़ाइल प्रलाणियाँ (nfs, smbfs, ncpfs, hpfs, इ॰) फ़ाइल नामों को परिवर्तित नहीं करतीं ; अतः वे यू॰टी॰ऍफ़॰-८ में यूनीकोड फ़ाइल नाम की सुविधा तभी प्रदान कर सकती हैं यदि दूसरी प्रचालन प्रलाणी में यह सुविधा हो । ध्यान दें कि भविष्य के सभी माउण्टों के लिये किसी माउण्ट विकल्प को लागू करने के लिये आप उसे सम्बन्धित /etc/fstab पङ्क्ति के चौथे खाने में जोड़ दे।
इन सभी पर्यावरण परिवर्तनीयों में लोकेल का नाम दिया जाना चाहिये :
LC_MESSAGES के बदले इसे देखा जाता है
अन्य सभी LC_* परिवर्तनीयों के बदले इसे देखा जाता है ।
इन सभी के लिये अलग अलग परिवर्तनीय हैं - अक्षर प्रकार व कूटबन्धन, प्राकृतिक भाषा के सन्देश, छँटनी के नियम, अङ्कलेखन प्रणाली, मुद्राङ्क लेखन प्रणाली, तिथि व समय प्रदर्शन ।
यदि किसी LC_* परिवर्तनीय को कोई नाम नहीं दिया गया है, तो इसका प्रयोग किया जायेगा ।
अपनी प्रणाली और सभी ऍप्लिकेशनों को यह बताने के लिये कि आप यू॰टी॰ऍफ़-८ का इस्तेमाल कर रहे हैं, आपको कूटसमूह का नाम लोकेल के नाम के बाद जोड़ना होगा । उ॰ यदि आप यू॰टी॰ऍफ़-८ हिन्दी लोकेल का प्रयोग बैश शेल के साथ करना चाहते हैं तो आप यह सूचित कर सकते हैं कि ऍप्लिकेशन को कौन सा पर्यावरण परिवर्तनीय भेजा जाये ।
$ LANG=hi_IN.UTF-8 xman |
export LANG=hi_IN.UTF-8 |