diff --git a/MDP.cpp b/MDP.cpp
index c087463..3e08f72 100644
--- a/MDP.cpp
+++ b/MDP.cpp
@@ -1,14 +1,14 @@
 /***
-Âí¶û¿Æ·ò¾ö²ß¹ý³ÌÖµµü´ú£¬¹Ø¼üÔÚÓÚµÚÒ»´Îµü´úÒªÀýÍâ£¬
-ÒòÎªÄ¿±ê×´Ì¬ÊÇÒ»¸öÖÕÖ¹×´Ì¬£¬·Åµ½µü´úÑ­»·ÀïÃæ»á³öÏÖ
-ÁÙ½üµÄ×´Ì¬»Ø±¨º¯ÊýÎÞÏÞµÄ£¬·¢É¢¡£
-µü´ú¹ý³Ì²ÉÓÃµÄÊÇÒì²½µü´ú£¬¼´Ã¿Ò»´ÎÄÚ²ãÑ­»·ÕÒµ½¸üÓÅµÄ
-»Ø±¨¾ÍÁ¢¼´¸üÐÂ×î´ó»Ø±¨£¬ÒÔ±ãÓëÖ®ÏàÁÚµÄ×´Ì¬ÄÜÁ¢¼´¸üÐÂµ½×îÓÅ
+é©¬å°”ç§‘å¤«å†³ç­–è¿‡ç¨‹å€¼è¿­ä»£ï¼Œå…³é”®åœ¨äºŽç¬¬ä¸€æ¬¡è¿­ä»£è¦ä¾‹å¤–ï¼Œ
+å› ä¸ºç›®æ ‡çŠ¶æ€æ˜¯ä¸€ä¸ªç»ˆæ­¢çŠ¶æ€ï¼Œæ”¾åˆ°è¿­ä»£å¾ªçŽ¯é‡Œé¢ä¼šå‡ºçŽ°
+ä¸´è¿‘çš„çŠ¶æ€å›žæŠ¥å‡½æ•°æ— é™çš„ï¼Œå‘æ•£ã€‚
+è¿­ä»£è¿‡ç¨‹é‡‡ç”¨çš„æ˜¯å¼‚æ­¥è¿­ä»£ï¼Œå³æ¯ä¸€æ¬¡å†…å±‚å¾ªçŽ¯æ‰¾åˆ°æ›´ä¼˜çš„
+å›žæŠ¥å°±ç«‹å³æ›´æ–°æœ€å¤§å›žæŠ¥ï¼Œä»¥ä¾¿ä¸Žä¹‹ç›¸é‚»çš„çŠ¶æ€èƒ½ç«‹å³æ›´æ–°åˆ°æœ€ä¼˜
 */
 
 /****
-Öµµü´ú
-Í¬²½¸üÐÂ
+å€¼è¿­ä»£
+åŒæ­¥æ›´æ–°
 12*12*7
 
 */
@@ -41,7 +41,7 @@ int main()
         -0.02,-0.02,-0.02,-0.02
     };
     double maxreward[size]= {0,0,0,0,0,0,0,0,0,0,0,0};
-    int action[size]= {4,0,1,-1,8,-1,10,-1,9,8,9,10}; //ÉÏÓÒÏÂ×ó{1,2,3,4}
+    int action[size]= {4,0,1,-1,8,-1,10,-1,9,8,9,10};//ç›´æŽ¥è¡¨ç¤ºå¯åˆ°èŠ‚ç‚¹çš„ä¸‹æ ‡
     int i=0,j=0,count=0;
     bool flag=0;
     for(i=0;i<size;i++)
@@ -55,20 +55,20 @@ int main()
                 maxreward[i]=reward[i]+maxreward[action[i]];
             else
                 maxreward[i]=reward[i];
-        }//·Åµ½ÕâÒâÎ¶×ÅÍ¬²½¸üÐÂ£¬count=1008ÊÇ12*12µÄ7±¶£¬¼´É¨ÁË7±é
-        for(i=0; i<size; i++)//¶ÔÃ¿Ò»¸ö×´Ì¬Çó×î´óµÄV(s)
+        }//æ”¾åˆ°è¿™æ„å‘³ç€åŒæ­¥æ›´æ–°ï¼Œcount=1008æ˜¯12*12çš„7å€ï¼Œå³æ‰«äº†7é
+        for(i=0; i<size; i++)//å¯¹æ¯ä¸€ä¸ªçŠ¶æ€æ±‚æœ€å¤§çš„V(s)
         {
-            for(j=0; j<size; j++)//²ßÂÔµü´úµÄ»°ÕâÀïÆäÊµ¿ÉÒÔ»»×öÉ¨Ò»±é²ßÂÔ¼¯£¬ÕâÒ²¾ÍÊÇºÍÖµµü´ú²»Í¬µÄµØ·½
+            for(j=0; j<size; j++)//ç­–ç•¥è¿­ä»£çš„è¯è¿™é‡Œå…¶å®žå¯ä»¥æ¢åšæ‰«ä¸€éç­–ç•¥é›†ï¼Œè¿™ä¹Ÿå°±æ˜¯å’Œå€¼è¿­ä»£ä¸åŒçš„åœ°æ–¹
             {
                 //cout<<"i="<<i<<"  "<<maxreward[i]<<"  "<<endl;
-                if(matrix[i][j]==1&&maxreward[j]>maxreward[i]-reward[i]+0.0001)//¸üÐÂÀÛ»ý»Ø±¨
+                if(matrix[i][j]==1&&maxreward[j]>maxreward[i]-reward[i]+0.0001)//æ›´æ–°ç´¯ç§¯å›žæŠ¥
                 {
                     action[i]=j;
                     //if(action[i]>0||action[i]==0)
-                        //maxreward[i]=reward[i]+maxreward[action[i]];//·Åµ½ÕâÊÇÒì²½¸üÐÂ£¬
+                        //maxreward[i]=reward[i]+maxreward[action[i]];//æ”¾åˆ°è¿™æ˜¯å¼‚æ­¥æ›´æ–°ï¼Œ
                     //else
                       //  maxreward[i]=reward[i];
-                    flag=0;//µ±ÀÛ»ý»Ø±¨²»ÔÙ¸üÐÂ£¬¼´²»½øÈë¸Ãif£¬ÄÇÃ´¾Í½áÊøµü´ú
+                    flag=0;//å½“ç´¯ç§¯å›žæŠ¥ä¸å†æ›´æ–°ï¼Œå³ä¸è¿›å…¥è¯¥ifï¼Œé‚£ä¹ˆå°±ç»“æŸè¿­ä»£
                 }
                 count++;
             }
@@ -89,7 +89,7 @@ int main()
 
 
 /*
-Öµµü´ú Òì²½¸üÐÂ 12*12*4
+å€¼è¿­ä»£ å¼‚æ­¥æ›´æ–° 12*12*4
 */
 /*
 #include <iostream>
@@ -127,13 +127,13 @@ int main()
     while(!flag)
     {
         flag=1;
-        for(i=0; i<size; i++)//¶ÔÃ¿Ò»¸ö×´Ì¬Çó×î´óµÄV(s)
+        for(i=0; i<size; i++)//å¯¹æ¯ä¸€ä¸ªçŠ¶æ€æ±‚æœ€å¤§çš„V(s)
         {
-            for(j=0; j<size; j++) //ÓÉÓÚ²»ÊÇ²ßÂÔµü´ú£¬Ö»ÄÜ±éÀúËùÓÐµÄ×´Ì¬£¬ÕÒ³öÄÜµ½µÄ£¬ÇÒ¸üÓÅµÄ
+            for(j=0; j<size; j++) //ç”±äºŽä¸æ˜¯ç­–ç•¥è¿­ä»£ï¼Œåªèƒ½éåŽ†æ‰€æœ‰çš„çŠ¶æ€ï¼Œæ‰¾å‡ºèƒ½åˆ°çš„ï¼Œä¸”æ›´ä¼˜çš„
             {
-                if(matrix[i][j]==1&&maxreward[j]>maxreward[i]-reward[i]+0.0001)//doubleÀàÐÍ±È½Ï´óÐ¡µÄÆ«²î£¬¼ÓÉÏÒ»¸öÐ¡Êý×÷Îª¾«¶È
+                if(matrix[i][j]==1&&maxreward[j]>maxreward[i]-reward[i]+0.0001)//doubleç±»åž‹æ¯”è¾ƒå¤§å°çš„åå·®ï¼ŒåŠ ä¸Šä¸€ä¸ªå°æ•°ä½œä¸ºç²¾åº¦
                 {
-                    maxreward[i]=reward[i]+maxreward[j];//Òì²½¸üÐÂ
+                    maxreward[i]=reward[i]+maxreward[j];//å¼‚æ­¥æ›´æ–°
                     flag=0;
                 }
                 count++;
@@ -149,7 +149,7 @@ int main()
 
 /***
 
-²ßÂÔµü´ú+Òì²½¸üÐÂ
+ç­–ç•¥è¿­ä»£+å¼‚æ­¥æ›´æ–°
 
 12*4*4
 */
@@ -182,7 +182,7 @@ int main()
         -0.02,-0.02,-0.02,-0.02
     };
     double maxreward[size]= {0,0,0,0,0,0,0,0,0,0,0,0};
-    int action[size]= {4,0,1,-1,8,-1,10,-1,9,8,9,10}; //ÉÏÓÒÏÂ×ó{1,2,3,4}
+    int action[size]= {4,0,1,-1,8,-1,10,-1,9,8,9,10}; //ä¸Šå³ä¸‹å·¦{1,2,3,4}
     int ac[ACTION]={-4,1,4,-1};
     int i=0,j=0,count=0;
     bool flag=0;
@@ -191,9 +191,9 @@ int main()
     while(!flag)
     {
         flag=1;
-        for(i=0; i<size; i++)//¶ÔÃ¿Ò»¸ö×´Ì¬Çó×î´óµÄV(s)
+        for(i=0; i<size; i++)//å¯¹æ¯ä¸€ä¸ªçŠ¶æ€æ±‚æœ€å¤§çš„V(s)
         {
-            for(j=0; j<ACTION; j++)//²ßÂÔµü´úµÄ»°ÕâÀïÆäÊµ¿ÉÒÔ»»×öÉ¨Ò»±é²ßÂÔ¼¯£¬ÕâÒ²¾ÍÊÇºÍÖµµü´ú²»Í¬µÄµØ·½
+            for(j=0; j<ACTION; j++)//ç­–ç•¥è¿­ä»£çš„è¯è¿™é‡Œå…¶å®žå¯ä»¥æ¢åšæ‰«ä¸€éç­–ç•¥é›†ï¼Œè¿™ä¹Ÿå°±æ˜¯å’Œå€¼è¿­ä»£ä¸åŒçš„åœ°æ–¹
             {
                 //cout<<"i="<<i<<"  "<<maxreward[i]<<"  "<<endl;
                 if(matrix[i][ac[j]+i]==1&&maxreward[ac[j]+i]>maxreward[i]-reward[i]+0.0001)