Fix broken subject line that I doubt has worked since we went rg=0
[squirrelmail.git] / functions / i18n.php
index 481d27b02a930b74ba2a31b7bbb035da06b4e356..cc9e3f9d3e00e9c540c24773d31b20e88bf7784c 100644 (file)
@@ -3,7 +3,7 @@
 /**
  * i18n.php
  *
- * Copyright (c) 1999-2002 The SquirrelMail Project Team
+ * Copyright (c) 1999-2003 The SquirrelMail Project Team
  * Licensed under the GNU GPL. For full terms see the file COPYING.
  *
  * This file contains variuos functions that are needed to do
@@ -25,10 +25,18 @@ function charset_decode ($charset, $string) {
     }
 
     /* All HTML special characters are 7 bit and can be replaced first */
-    $string = htmlspecialchars ($string);
+    
+    /* NOTE Marc Groot Koerkamp: This is the wrong place to do 
+       htmlspecialchars, It should be done before the echo.
+       By doing it here we get double htmlspecialchars calls which translates
+        < => &lt; => &amp;lt;
+    */
+    //$string = htmlspecialchars ($string);
 
     $charset = strtolower($charset);
 
+    set_my_charset() ;
+
     if (ereg('iso-8859-([[:digit:]]+)', $charset, $res)) {
         if ($res[1] == '1') {
             $ret = charset_decode_iso_8859_1 ($string);
@@ -36,8 +44,12 @@ function charset_decode ($charset, $string) {
             $ret = charset_decode_iso_8859_2 ($string);
         } else if ($res[1] == '4') {
             $ret = charset_decode_iso_8859_4 ($string);
+        } else if ($res[1] == '5') {
+            $ret = charset_decode_iso_8859_5 ($string);
         } else if ($res[1] == '7') {
             $ret = charset_decode_iso_8859_7 ($string);
+        } else if ($res[1] == '9') {
+            $ret = charset_decode_iso_8859_9 ($string);
         } else if ($res[1] == '13') {
             $ret = charset_decode_iso_8859_13 ($string);
         } else if ($res[1] == '15') {
@@ -50,7 +62,15 @@ function charset_decode ($charset, $string) {
     } else if ($charset == 'koi8-r') {
         $ret = charset_decode_koi8r ($string);
     } else if ($charset == 'windows-1251') {
-        $ret = charset_decode_koi8r ($string);
+        $ret = charset_decode_windows_1251 ($string);
+    } else if ($charset == 'windows-1253') {
+       $ret = charset_decode_windows_1253 ($string);
+    } else if ($charset == 'windows-1254') {
+       $ret = charset_decode_windows_1254 ($string);
+    } else if ($charset == 'windows-1257') {
+        $ret = charset_decode_windows_1257 ($string);
+    } else if ($charset == 'utf-8') {
+       $ret = charset_decode_utf8 ($string);
     } else {
         $ret = $string;
     }
@@ -408,49 +428,71 @@ function charset_decode_iso_8859_2 ($string) {
 }
 
 /* 
-   iso-8859-4 is Baltic codeset used in some email clients 
-   instead of iso-8859-13 in Lithuania 
-   only Lithuanian charactes are added.
+ ISO/IEC 8859-4:1998 Latin Alphabet No. 4
 */
 
 function charset_decode_iso_8859_4 ($string) {
-    // latin capital a with ogonek
-    $string = str_replace ("\241", '&#0260;', $string);
-    // latin capital c with caron
-    $string = str_replace ("\310", '&#0268;', $string);
-    // latin capital e with ogonek
-    $string = str_replace ("\312", '&#0280;', $string);
-    // latin capital e with dot above
-    $string = str_replace ("\314", '&#0278;', $string);
-    // latin capital i with ogonek
-    $string = str_replace ("\307", '&#0302;', $string);
-    // latin capital s with caron
-    $string = str_replace ("\251", '&#0352;', $string);
-    // latin capital u with ogonek
-    $string = str_replace ("\331", '&#0370;', $string);
-    // latin capital u with macron
-    $string = str_replace ("\336", '&#0362;', $string);
-    // latin capital z with caron
-    $string = str_replace ("\256", '&#0381;', $string);
-    // latin small a with ogonek
-    $string = str_replace ("\261", '&#0261;', $string);
-    // latin small c with caron
-    $string = str_replace ("\350", '&#0269;', $string);
-    // latin small e with ogonek
-    $string = str_replace ("\352", '&#0281;', $string);
-    // latin small e with dot above
-    $string = str_replace ("\354", '&#0279;', $string);
-    // latin small i with ogonek
-    $string = str_replace ("\347", '&#0303;', $string);
-    // latin small s with caron
-    $string = str_replace ("\271", '&#0353;', $string);
-    // latin small u with ogonek
-    $string = str_replace ("\371", '&#0371;', $string);
-    // latin small u with macron
-    $string = str_replace ("\376", '&#0363;', $string);
-    // latin small z with caron
-    $string = str_replace ("\276", '&#0382;', $string);
+    global $default_charset;
 
+    if (strtolower($default_charset) == 'iso-8859-4')
+        return $string;
+
+    /* Only do the slow convert if there are 8-bit characters */
+    if (! ereg("[\200-\377]", $string))
+        return $string;
+
+    $string = str_replace ("\241", '&#260;', $string);
+    $string = str_replace ("\242", '&#312;', $string);
+    $string = str_replace ("\243", '&#342;', $string);
+    $string = str_replace ("\245", '&#296;', $string);
+    $string = str_replace ("\246", '&#315;', $string);
+    $string = str_replace ("\251", '&#352;', $string);
+    $string = str_replace ("\252", '&#274;', $string);
+    $string = str_replace ("\253", '&#290;', $string);
+    $string = str_replace ("\254", '&#358;', $string);
+    $string = str_replace ("\256", '&#381;', $string);
+    $string = str_replace ("\261", '&#261;', $string);
+    $string = str_replace ("\262", '&#731;', $string);
+    $string = str_replace ("\263", '&#343;', $string);
+    $string = str_replace ("\265", '&#297;', $string);
+    $string = str_replace ("\266", '&#316;', $string);
+    $string = str_replace ("\267", '&#711;', $string);
+    $string = str_replace ("\271", '&#353;', $string);
+    $string = str_replace ("\272", '&#275;', $string);
+    $string = str_replace ("\273", '&#291;', $string);
+    $string = str_replace ("\274", '&#359;', $string);
+    $string = str_replace ("\275", '&#330;', $string);
+    $string = str_replace ("\276", '&#382;', $string);
+    $string = str_replace ("\277", '&#331;', $string);
+    $string = str_replace ("\300", '&#256;', $string);
+    $string = str_replace ("\307", '&#302;', $string);
+    $string = str_replace ("\310", '&#268;', $string);
+    $string = str_replace ("\312", '&#280;', $string);
+    $string = str_replace ("\314", '&#278;', $string);
+    $string = str_replace ("\317", '&#298;', $string);
+    $string = str_replace ("\320", '&#272;', $string);
+    $string = str_replace ("\321", '&#325;', $string);
+    $string = str_replace ("\322", '&#332;', $string);
+    $string = str_replace ("\323", '&#310;', $string);
+    $string = str_replace ("\331", '&#370;', $string);
+    $string = str_replace ("\335", '&#360;', $string);
+    $string = str_replace ("\336", '&#362;', $string);
+    $string = str_replace ("\340", '&#257;', $string);
+    $string = str_replace ("\347", '&#303;', $string);
+    $string = str_replace ("\350", '&#269;', $string);
+    $string = str_replace ("\352", '&#281;', $string);
+    $string = str_replace ("\354", '&#279;', $string);
+    $string = str_replace ("\357", '&#299;', $string);
+    $string = str_replace ("\360", '&#273;', $string);
+    $string = str_replace ("\361", '&#326;', $string);
+    $string = str_replace ("\362", '&#333;', $string);
+    $string = str_replace ("\363", '&#311;', $string);
+    $string = str_replace ("\371", '&#371;', $string);
+    $string = str_replace ("\375", '&#361;', $string);
+    $string = str_replace ("\376", '&#363;', $string);
+    $string = str_replace ("\377", '&#729;', $string);
+
+    // rest of charset is the same as ISO-8859-1
     return (charset_decode_iso_8859_1($string));
 }
 
@@ -492,7 +534,7 @@ function charset_decode_iso_8859_7 ($string) {
      * ISO-8859-7 characters from 11/04 (0xB4) to 11/06 (0xB6)
      * These are Unicode 900-902
      */
-    $string = preg_replace("/([\264-\266])/e",'&#' . (ord("\\1")+720),$string);
+    $string = preg_replace("/([\264-\266])/e","'&#' . (ord('\\1')+720);",$string);
     
     /* 11/07 (0xB7) Middle dot is the same in iso-8859-1 */
     $string = str_replace("\267", '&#183;', $string);
@@ -501,7 +543,7 @@ function charset_decode_iso_8859_7 ($string) {
      * ISO-8859-7 characters from 11/08 (0xB8) to 11/10 (0xBA)
      * These are Unicode 900-902
      */
-    $string = preg_replace("/([\270-\272])/e",'&#' . (ord("\\1")+720),$string);
+    $string = preg_replace("/([\270-\272])/e","'&#' . (ord('\\1')+720);",$string);
 
     /*
      * 11/11 (0xBB) Right angle quotation mark is the same as in
@@ -510,54 +552,113 @@ function charset_decode_iso_8859_7 ($string) {
     $string = str_replace("\273", '&#187;', $string);
 
     /* And now the rest of the charset */
-    $string = preg_replace("/([\274-\376])/",'&#'.(ord("\\1")+720),$string);
+    $string = preg_replace("/([\274-\376])/e","'&#'.(ord('\\1')+720);",$string);
 
     return $string;
 }
 
 /*
- iso-8859-13 codeset used in Lithuania
- only Lithuanian charactes are added.
+ ISOIEC 8859-9:1999 Latin Alphabet No. 5
 */
+function charset_decode_iso_8859_9 ($string) {
+    global $default_charset;
+
+    if (strtolower($default_charset) == 'iso-8859-9')
+        return $string;
 
+    /* Only do the slow convert if there are 8-bit characters */
+    if (! ereg("[\200-\377]", $string))
+        return $string;
+
+    // latin capital letter g with breve 208->286
+    $string = str_replace("\320", '&#286;', $string);
+    // latin capital letter i with dot above 221->304
+    $string = str_replace("\335", '&#304;', $string);
+    // latin capital letter s with cedilla 222->350
+    $string = str_replace("\336", '&#350;', $string);
+    // latin small letter g with breve 240->287
+    $string = str_replace("\360", '&#287;', $string);
+    // latin small letter dotless i 253->305
+    $string = str_replace("\375", '&#305;', $string);
+    // latin small letter s with cedilla 254->351
+    $string = str_replace("\376", '&#351;', $string);
+
+    // rest of charset is the same as ISO-8859-1
+    return (charset_decode_iso_8859_1($string));
+}
+
+
+/*
+ ISO/IEC 8859-13:1998 Latin Alphabet No. 7 (Baltic Rim) 
+*/
 function charset_decode_iso_8859_13 ($string) {
-    // latin capital a with ogonek
-    $string = str_replace ("\300", '&#0260;', $string);
-    // latin capital c with caron
-    $string = str_replace ("\310", '&#0268;', $string);
-    // latin capital e with ogonek
-    $string = str_replace ("\306", '&#0280;', $string);
-    // latin capital e with dot above
-    $string = str_replace ("\313", '&#0278;', $string);
-    // latin capital i with ogonek
-    $string = str_replace ("\301", '&#0302;', $string);
-    // latin capital s with caron
-    $string = str_replace ("\320", '&#0352;', $string);
-    // latin capital u with ogonek
-    $string = str_replace ("\330", '&#0370;', $string);
-    // latin capital u with macron
-    $string = str_replace ("\333", '&#0362;', $string);
-    // latin capital z with caron
-    $string = str_replace ("\336", '&#0381;', $string);
-    // latin small a with ogonek
-    $string = str_replace ("\340", '&#0261;', $string);
-    // latin small c with caron
-    $string = str_replace ("\350", '&#0269;', $string);
-    // latin small e with ogonek
-    $string = str_replace ("\346", '&#0281;', $string);
-    // latin small e with dot above
-    $string = str_replace ("\353", '&#0279;', $string);
-    // latin small i with ogonek
-    $string = str_replace ("\341", '&#0303;', $string);
-    // latin small s with caron
-    $string = str_replace ("\360", '&#0353;', $string);
-    // latin small u with ogonek
-    $string = str_replace ("\370", '&#0371;', $string);
-    // latin small u with macron
-    $string = str_replace ("\373", '&#0363;', $string);
-    // latin small z with caron
-    $string = str_replace ("\376", '&#0382;', $string);
+    global $default_charset;
 
+    if (strtolower($default_charset) == 'iso-8859-13')
+        return $string;
+
+    /* Only do the slow convert if there are 8-bit characters */
+    if (! ereg("[\200-\377]", $string))
+        return $string;
+
+    $string = str_replace ("\241", '&#8221;', $string);
+    $string = str_replace ("\245", '&#8222;', $string);
+    $string = str_replace ("\250", '&#216;', $string);
+    $string = str_replace ("\252", '&#342;', $string);
+    $string = str_replace ("\257", '&#198;', $string);
+    $string = str_replace ("\264", '&#8220;', $string);
+    $string = str_replace ("\270", '&#248;', $string);
+    $string = str_replace ("\272", '&#343;', $string);
+    $string = str_replace ("\277", '&#230;', $string);
+    $string = str_replace ("\300", '&#260;', $string);
+    $string = str_replace ("\301", '&#302;', $string);
+    $string = str_replace ("\302", '&#256;', $string);
+    $string = str_replace ("\303", '&#262;', $string);
+    $string = str_replace ("\306", '&#280;', $string);
+    $string = str_replace ("\307", '&#274;', $string);
+    $string = str_replace ("\310", '&#268;', $string);
+    $string = str_replace ("\312", '&#377;', $string);
+    $string = str_replace ("\313", '&#278;', $string);
+    $string = str_replace ("\314", '&#290;', $string);
+    $string = str_replace ("\315", '&#310;', $string);
+    $string = str_replace ("\316", '&#298;', $string);
+    $string = str_replace ("\317", '&#315;', $string);
+    $string = str_replace ("\320", '&#352;', $string);
+    $string = str_replace ("\321", '&#323;', $string);
+    $string = str_replace ("\322", '&#325;', $string);
+    $string = str_replace ("\324", '&#332;', $string);
+    $string = str_replace ("\330", '&#370;', $string);
+    $string = str_replace ("\331", '&#321;', $string);
+    $string = str_replace ("\332", '&#346;', $string);
+    $string = str_replace ("\333", '&#362;', $string);
+    $string = str_replace ("\335", '&#379;', $string);
+    $string = str_replace ("\336", '&#381;', $string);
+    $string = str_replace ("\340", '&#261;', $string);
+    $string = str_replace ("\341", '&#303;', $string);
+    $string = str_replace ("\342", '&#257;', $string);
+    $string = str_replace ("\343", '&#263;', $string);
+    $string = str_replace ("\346", '&#281;', $string);
+    $string = str_replace ("\347", '&#275;', $string);
+    $string = str_replace ("\350", '&#269;', $string);
+    $string = str_replace ("\352", '&#378;', $string);
+    $string = str_replace ("\353", '&#279;', $string);
+    $string = str_replace ("\354", '&#291;', $string);
+    $string = str_replace ("\355", '&#311;', $string);
+    $string = str_replace ("\356", '&#299;', $string);
+    $string = str_replace ("\357", '&#316;', $string);
+    $string = str_replace ("\360", '&#353;', $string);
+    $string = str_replace ("\361", '&#324;', $string);
+    $string = str_replace ("\362", '&#326;', $string);
+    $string = str_replace ("\364", '&#333;', $string);
+    $string = str_replace ("\370", '&#371;', $string);
+    $string = str_replace ("\371", '&#322;', $string);
+    $string = str_replace ("\372", '&#347;', $string);
+    $string = str_replace ("\373", '&#363;', $string);    
+    $string = str_replace ("\375", '&#380;', $string);
+    $string = str_replace ("\376", '&#382;', $string);
+    $string = str_replace ("\377", '&#8217;', $string);
+
+    // rest of charset is the same as ISO-8859-1
     return (charset_decode_iso_8859_1($string));
 }
 
@@ -776,6 +877,234 @@ function charset_decode_koi8r ($string) {
     return $string;
 }
 
+/*
+ windows-1254 (Turks)
+ */
+function charset_decode_windows_1254 ($string) {
+    global $default_charset;
+
+    if (strtolower($default_charset) == 'windows-1254')
+        return $string;
+
+    /* Only do the slow convert if there are 8-bit characters */
+    if (! ereg("[\200-\377]", $string))
+        return $string;
+
+    // Euro sign 128 -> 8364
+    $string = str_replace("\200", '&#8364;', $string);
+    // Single low-9 quotation mark 130 -> 8218
+    $string = str_replace("\202", '&#8218;', $string);
+    // latin small letter f with hook 131 -> 402
+    $string = str_replace("\203", '&#402;', $string);
+    // Double low-9 quotation mark 132 -> 8222
+    $string = str_replace("\204", '&#8222;', $string);
+    // horizontal ellipsis 133 -> 8230
+    $string = str_replace("\205", '&#8230;', $string);
+    // dagger 134 -> 8224
+    $string = str_replace("\206", '&#8224;', $string);
+    // double dagger 135 -> 8225
+    $string = str_replace("\207", '&#8225;', $string);
+    // modifier letter circumflex accent 136->710
+    $string = str_replace("\210", '&#710;', $string);
+    // per mille sign 137 -> 8240
+    $string = str_replace("\211", '&#8240;', $string);
+    // latin capital letter s with caron 138 -> 352
+    $string = str_replace("\212", '&#352;', $string);
+    // single left-pointing angle quotation mark 139 -> 8249
+    $string = str_replace("\213", '&#8249;', $string);
+    // latin capital ligature oe 140 -> 338
+    $string = str_replace("\214", '&#338;', $string);
+    // left single quotation mark 145 -> 8216
+    $string = str_replace("\221", '&#8216;', $string);
+    // right single quotation mark 146 -> 8217
+    $string = str_replace("\222", '&#8217;', $string);
+    // left double quotation mark 147 -> 8220
+    $string = str_replace("\223", '&#8220;', $string);
+    // right double quotation mark 148 -> 8221
+    $string = str_replace("\224", '&#8221;', $string);
+    // bullet 149 -> 8226
+    $string = str_replace("\225", '&#8226;', $string);
+    // en dash 150 -> 8211
+    $string = str_replace("\226", '&#8211;', $string);
+    // em dash 151 -> 8212
+    $string = str_replace("\227", '&#8212;', $string);
+    // small tilde 152 -> 732
+    $string = str_replace("\230", '&#732;', $string);
+    // trade mark sign 153 -> 8482
+    $string = str_replace("\231", '&#8482;', $string);
+    // latin small letter s with caron 154 -> 353
+    $string = str_replace("\232", '&#353;', $string);
+    // single right-pointing angle quotation mark 155 -> 8250
+    $string = str_replace("\233", '&#8250;', $string);
+    // latin small ligature oe 156 -> 339
+    $string = str_replace("\234", '&#339;', $string);
+    // latin capital letter y with diaresis 159->376
+    $string = str_replace("\237", '&#376;', $string);
+    // latin capital letter g with breve 208->286
+    $string = str_replace("\320", '&#286;', $string);
+    // latin capital letter i with dot above 221->304
+    $string = str_replace("\335", '&#304;', $string);
+    // latin capital letter s with cedilla 222->350
+    $string = str_replace("\336", '&#350;', $string);
+    // latin small letter g with breve 240->287
+    $string = str_replace("\360", '&#287;', $string);
+    // latin small letter dotless i 253->305
+    $string = str_replace("\375", '&#305;', $string);
+    // latin small letter s with cedilla 254->351
+    $string = str_replace("\376", '&#351;', $string);
+
+    // Rest of charset is like iso-8859-1
+    return (charset_decode_iso_8859_1($string));
+}
+
+/*
+ windows-1253 (Greek)
+ */
+function charset_decode_windows_1253 ($string) {
+    global $default_charset;
+
+    if (strtolower($default_charset) == 'windows-1253')
+        return $string;
+
+    /* Only do the slow convert if there are 8-bit characters */
+    if (! ereg("[\200-\377]", $string))
+        return $string;
+
+    $string = str_replace("\200", '&#8364;', $string);
+    $string = str_replace("\202", '&#8218;', $string);
+    $string = str_replace("\203", '&#402;', $string);
+    $string = str_replace("\204", '&#8222;', $string);
+    $string = str_replace("\205", '&#8230;', $string);
+    $string = str_replace("\206", '&#8224;', $string);
+    $string = str_replace("\207", '&#8225;', $string);
+    $string = str_replace("\211", '&#8240;', $string);
+    $string = str_replace("\213", '&#8249;', $string);
+    $string = str_replace("\221", '&#8216;', $string);
+    $string = str_replace("\222", '&#8217;', $string);
+    $string = str_replace("\223", '&#8220;', $string);
+    $string = str_replace("\224", '&#8221;', $string);
+    $string = str_replace("\225", '&#8226;', $string);
+    $string = str_replace("\226", '&#8211;', $string);
+    $string = str_replace("\227", '&#8212;', $string);
+    $string = str_replace("\231", '&#8482;', $string);
+    $string = str_replace("\233", '&#8250;', $string);
+    $string = str_replace("\241", '&#901;', $string);
+    $string = str_replace("\242", '&#902;', $string);
+    $string = str_replace ("\257", '&#8213;', $string);
+    $string = str_replace("\264", '&#900;', $string);
+    $string = str_replace("\270", '&#904;', $string);
+    $string = str_replace ("\271", '&#905;', $string);
+    $string = str_replace ("\272", '&#906;', $string);
+    $string = str_replace ("\274", '&#908;', $string);
+    // cycle for 190-254 symbols
+    $string = preg_replace("/([\274-\376])/e","'&#' . (ord('\\1')+720);",$string);
+
+    // Rest of charset is like iso-8859-1
+    return (charset_decode_iso_8859_1($string));
+}
+
+
+/*
+ windows-1257 (BaltRim)
+ */
+function charset_decode_windows_1257 ($string) {
+    global $default_charset;
+
+    if (strtolower($default_charset) == 'windows-1257')
+        return $string;
+
+    /* Only do the slow convert if there are 8-bit characters */
+    if (! ereg("[\200-\377]", $string))
+        return $string;
+
+    $string = str_replace("\200", '&#8364;', $string);
+    $string = str_replace("\202", '&#8218;', $string);
+    $string = str_replace("\204", '&#8222;', $string);
+    $string = str_replace("\205", '&#8230;', $string);
+    $string = str_replace("\206", '&#8224;', $string);
+    $string = str_replace("\207", '&#8225;', $string);
+    $string = str_replace("\211", '&#8240;', $string);
+    $string = str_replace("\213", '&#8249;', $string);
+    $string = str_replace("\215", '&#168;', $string);
+    $string = str_replace("\216", '&#711;', $string);
+    $string = str_replace("\217", '&#184;', $string);
+    $string = str_replace("\221", '&#8216;', $string);
+    $string = str_replace("\222", '&#8217;', $string);
+    $string = str_replace("\223", '&#8220;', $string);
+    $string = str_replace("\224", '&#8221;', $string);
+    $string = str_replace("\225", '&#8226;', $string);
+    $string = str_replace("\226", '&#8211;', $string);
+    $string = str_replace("\227", '&#8212;', $string);
+    $string = str_replace("\231", '&#8482;', $string);
+    $string = str_replace("\233", '&#8250;', $string);
+    $string = str_replace("\235", '&#175;', $string);
+    $string = str_replace("\236", '&#731;', $string);
+    $string = str_replace ("\250", '&#216;', $string);
+    $string = str_replace ("\252", '&#342;', $string);
+    $string = str_replace ("\257", '&#198;', $string);
+    $string = str_replace ("\270", '&#248;', $string);
+    $string = str_replace ("\272", '&#343;', $string);
+    $string = str_replace ("\277", '&#230;', $string);
+    $string = str_replace ("\300", '&#260;', $string);
+    $string = str_replace ("\301", '&#302;', $string);
+    $string = str_replace ("\302", '&#256;', $string);
+    $string = str_replace ("\303", '&#262;', $string);
+    $string = str_replace ("\306", '&#280;', $string);
+    $string = str_replace ("\307", '&#274;', $string);
+    $string = str_replace ("\310", '&#268;', $string);
+    $string = str_replace ("\312", '&#377;', $string);
+    $string = str_replace ("\313", '&#278;', $string);
+    $string = str_replace ("\314", '&#290;', $string);
+    $string = str_replace ("\315", '&#310;', $string);
+    $string = str_replace ("\316", '&#298;', $string);
+    $string = str_replace ("\317", '&#315;', $string);
+    $string = str_replace ("\320", '&#352;', $string);
+    $string = str_replace ("\321", '&#323;', $string);
+    $string = str_replace ("\322", '&#325;', $string);
+    $string = str_replace ("\324", '&#332;', $string);
+    $string = str_replace ("\330", '&#370;', $string);
+    $string = str_replace ("\331", '&#321;', $string);
+    $string = str_replace ("\332", '&#340;', $string);
+    $string = str_replace ("\333", '&#362;', $string);
+    $string = str_replace ("\335", '&#379;', $string);
+    $string = str_replace ("\336", '&#381;', $string);
+    $string = str_replace ("\340", '&#261;', $string);
+    $string = str_replace ("\341", '&#303;', $string);
+    $string = str_replace ("\342", '&#257;', $string);
+    $string = str_replace ("\343", '&#263;', $string);
+    $string = str_replace ("\346", '&#281;', $string);
+    $string = str_replace ("\347", '&#275;', $string);
+    $string = str_replace ("\350", '&#269;', $string);
+    $string = str_replace ("\352", '&#378;', $string);
+    $string = str_replace ("\353", '&#279;', $string);
+    $string = str_replace ("\354", '&#291;', $string);
+    $string = str_replace ("\355", '&#311;', $string);
+    $string = str_replace ("\356", '&#299;', $string);
+    $string = str_replace ("\357", '&#316;', $string);
+    $string = str_replace ("\360", '&#353;', $string);
+    $string = str_replace ("\361", '&#324;', $string);
+    $string = str_replace ("\362", '&#326;', $string);
+    $string = str_replace ("\364", '&#333;', $string);
+    $string = str_replace ("\370", '&#371;', $string);
+    $string = str_replace ("\371", '&#322;', $string);
+    $string = str_replace ("\372", '&#347;', $string);
+    $string = str_replace ("\373", '&#363;', $string);    
+    $string = str_replace ("\375", '&#380;', $string);
+    $string = str_replace ("\376", '&#382;', $string);
+    $string = str_replace ("\377", '&#729;', $string);
+
+    // Rest of charset is like iso-8859-1
+    return (charset_decode_iso_8859_1($string));
+}
+
+/* windows-1251 is Microsoft Cyrillic encoding */
+function charset_decode_windows_1251 ($string) {
+    // Convert to KOI8-R, then return this decoded.
+    $string = convert_cyr_string($string, 'w', 'k');
+    return charset_decode_koi8r($string);
+}
+
+
 
 /*
  * Set up the language to be output
@@ -792,6 +1121,7 @@ function set_up_language($sm_language, $do_search = false) {
     if ($SetupAlready) {
         return;
     }
+
     $SetupAlready = TRUE;
 
     if ($do_search && ! $sm_language && isset($_SERVER['HTTP_ACCEPT_LANGUAGE'])) {
@@ -811,7 +1141,7 @@ function set_up_language($sm_language, $do_search = false) {
          $use_gettext &&
          $sm_language != '' &&
          isset($languages[$sm_notAlias]['CHARSET']) ) {
-        bindtextdomain( 'squirrelmail', '../locale/' );
+        bindtextdomain( 'squirrelmail', SM_PATH . 'locale/' );
         textdomain( 'squirrelmail' );
         if ( !ini_get('safe_mode') &&
              getenv( 'LC_ALL' ) != $sm_notAlias ) {
@@ -845,11 +1175,11 @@ function set_my_charset(){
      * selection. This is "more right" (tm), than just stamping the
      * message blindly with the system-wide $default_charset.
      */
-    global $data_dir, $username, $default_charset, $languages;
+    global $data_dir, $username, $default_charset, $languages, $squirrelmail_default_language;
 
     $my_language = getPref($data_dir, $username, 'language');
     if (!$my_language) {
-        return;
+        $my_language = $squirrelmail_default_language ;
     }
     while (isset($languages[$my_language]['ALIAS'])) {
         $my_language = $languages[$my_language]['ALIAS'];
@@ -893,6 +1223,10 @@ $languages['de']['ALIAS'] = 'de_DE';
 // There is no en_EN! There is en_US, en_BR, en_AU, and so forth, 
 // but who cares about !US, right? Right? :)
 
+$languages['el_GR']['NAME']    = 'Greek';
+$languages['el_GR']['CHARSET'] = 'iso-8859-7';
+$languages['el']['ALIAS'] = 'el_GR';
+
 $languages['en_US']['NAME']    = 'English';
 $languages['en_US']['CHARSET'] = 'iso-8859-1';
 $languages['en']['ALIAS'] = 'en_US';
@@ -979,13 +1313,13 @@ $languages['tr_TR']['NAME']    = 'Turkish';
 $languages['tr_TR']['CHARSET'] = 'iso-8859-9';
 $languages['tr']['ALIAS'] = 'tr_TR';
 
-$languages['zh_TW']['NAME']    = 'Taiwan';
+$languages['zh_TW']['NAME']    = 'Chinese Trad';
 $languages['zh_TW']['CHARSET'] = 'big5';
 $languages['tw']['ALIAS'] = 'zh_TW';
 
-$languages['zh_TW']['NAME']    = 'Chinese';
-$languages['zh_TW']['CHARSET'] = 'gb2312';
-$languages['tw']['ALIAS'] = 'zh_CN';
+$languages['zh_CN']['NAME']    = 'Chinese Simp';
+$languages['zh_CN']['CHARSET'] = 'gb2312';
+$languages['cn']['ALIAS'] = 'zh_CN';
 
 $languages['sk_SK']['NAME']     = 'Slovak';
 $languages['sk_SK']['CHARSET']  = 'iso-8859-2';
@@ -1000,7 +1334,7 @@ $languages['th_TH']['CHARSET'] = 'tis-620';
 $languages['th']['ALIAS'] = 'th_TH';
 
 $languages['lt_LT']['NAME']    = 'Lithuanian';
-$languages['lt_LT']['CHARSET'] = 'iso-8859-13';
+$languages['lt_LT']['CHARSET'] = 'windows-1257';
 $languages['lt']['ALIAS'] = 'lt_LT';
 
 $languages['sl_SI']['NAME']    = 'Slovenian';
@@ -1011,13 +1345,24 @@ $languages['bg_BG']['NAME']    = 'Bulgarian';
 $languages['bg_BG']['CHARSET'] = 'windows-1251';
 $languages['bg']['ALIAS'] = 'bg_BG';
 
+$languages['uk_UA']['NAME']    = 'Ukrainian';
+$languages['uk_UA']['CHARSET'] = 'koi8-u';
+$languages['uk']['ALIAS'] = 'uk_UA';
+
 // Right to left languages
 
-$languages['he_HE']['NAME']    = 'Hebrew';
-$languages['he_HE']['CHARSET'] = 'windows-1255';
-$languages['he_HE']['DIR']     = 'rtl';
-$languages['he']['ALIAS']      = 'he_HE';
+$languages['ar']['NAME']    = 'Arabic';
+$languages['ar']['CHARSET'] = 'windows-1256';
+$languages['ar']['DIR']     = 'rtl';
+
+$languages['he_IL']['NAME']    = 'Hebrew';
+$languages['he_IL']['CHARSET'] = 'windows-1255';
+$languages['he_IL']['DIR']     = 'rtl';
+$languages['he']['ALIAS']      = 'he_IL';
 
+$languages['vi_VN']['NAME']    = 'Vietnamese';
+$languages['vi_VN']['CHARSET'] = 'utf-8';
+$languages['vi']['ALIAS'] = 'vi_VN';
 
 /* Detect whether gettext is installed. */
 $gettext_flags = 0;
@@ -1058,6 +1403,39 @@ elseif ($gettext_flags == 0) {
     }
 }
 
+function charset_decode_utf8 ($string) {
+/*
+    Every decoded character consists of n bytes. First byte is octal
+    300-375, other bytes - always octals 200-277.
+
+    \a\b characters are decoded to html code octdec(a-300)*64 + octdec(b-200)
+    \a\b\c characters are decoded to html code octdec(a-340)*64*64 + octdec(b-200)*64 + octdec(c-200)
+    
+    decoding cycle is unfinished. please test and report problems to tokul@users.sourceforge.net
+*/
+    global $default_charset, $languages, $sm_notAlias;
+
+    if (strtolower($default_charset) == 'utf-8')
+        return $string;
+    if (strtolower($languages[$sm_notAlias]['CHARSET']) == 'utf-8')
+        return $string;
+
+    /* Only do the slow convert if there are 8-bit characters */
+    if (! ereg("[\200-\377]", $string))
+        return $string;
+
+    // decode three byte unicode characters
+    $string = preg_replace("/([\340-\357])([\200-\277])([\200-\277])/e",
+    "'&#'.((ord('\\1')-224)*4096+(ord('\\2')-128)*64+(ord('\\3')-128)).';'",
+    $string);
+
+    // decode two byte unicode characters
+    $string = preg_replace("/([\300-\337])([\200-\277])/e",
+    "'&#'.((ord('\\1')-192)*64+(ord('\\2')-128)).';'",
+    $string);
+
+    return $string;
+}
 
 /*
  * Japanese charset extra function