diff --git a/README.md b/README.md
index 7f0772c..7d33734 100644
--- a/README.md
+++ b/README.md
@@ -4,6 +4,8 @@
 
 In this repository, I go through some of the ways you can parse and process the location translation / altnames / alternative names / location name in a foreign language database from Geonames.org.
 
+> Please note that this database is in active development.
+
 The alternames database contains geoname_id, language, and the name of the location in that language.
 
 ![CSV file](image-1.png)
@@ -49,6 +51,14 @@ Getting the altname using the included JSON file:
 {'pt': 'Oslo', 'en': 'Oslo', 'ko': '오슬로', 'ru': 'Осло', 'ja': 'オスロ', 'ar': 'أوسلو', 'es': 'Oslo', 'zh': '奥斯陆', 'de': 'Oslo', 'fr': 'Oslo'}
 ```
 
+Aside from the ISO language code, the dataset also contains the `preferred` (preferred or official name) and `shortname` (shortname for the location) values.
+
+Notes / Subjective Decisions:
+
+> This is the beginning of a public database project. So, your opinion matters. Please open an issue to provide feedback.
+
+- Note that for rows where the `preferred` ISO language is `en`, we have removed them as if the `preferred` ISO language is not present, the fallback value should default to English.
+- Where multiple entries are made for the same language, we have chosen the first entry. There obviously a better solution for this.
 
 The included notebook and databases can be used with a variety of IPinfo IP databases that include location information.
 
diff --git a/geoname_alt_names.zip b/geoname_alt_names.zip
index 208e379..1c404f0 100644
Binary files a/geoname_alt_names.zip and b/geoname_alt_names.zip differ
diff --git a/processing_geonames_altnames.ipynb b/processing_geonames_altnames.ipynb
index 61b83fc..4b5c8f8 100644
--- a/processing_geonames_altnames.ipynb
+++ b/processing_geonames_altnames.ipynb
@@ -2,7 +2,7 @@
  "cells": [
   {
    "cell_type": "code",
-   "execution_count": 14,
+   "execution_count": 2,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -23,20 +23,20 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 12,
+   "execution_count": 5,
    "metadata": {},
    "outputs": [],
    "source": [
     "alternate_names_columns = ['alternateNameId', 'geonameid', 'isolanguage', 'alternate name', 'isPreferredName', 'isShortName', 'isColloquial', 'isHistoric', 'from', 'to']\n",
     "alternate_names_dtypes = {'alternateNameId': int, 'geonameid': int, 'isolanguage': str, 'alternate name': str, 'isPreferredName':str, 'isShortName':str, 'isColloquial':str, 'isHistoric':str, 'from':str, 'to': str}\n",
-    "filename = 'alternateNamesV2.txt'\n",
+    "filename = './alternateNamesV2.txt'\n",
     "alname_df = pd.read_csv(filename, sep='\\t', header=None, names=alternate_names_columns, dtype=alternate_names_dtypes)\n",
     "alname_df.fillna('', inplace=True)"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 13,
+   "execution_count": 6,
    "metadata": {},
    "outputs": [
     {
@@ -158,7 +158,7 @@
        "4                                                              "
       ]
      },
-     "execution_count": 13,
+     "execution_count": 6,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -178,7 +178,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Step 1: Preparsing\n",
+    "Preparsing\n",
     "- ISO language code are 2 letters (Major filter)\n",
     "- We need to remove where ISO language values are empty\n",
     "- We need to remove where Geoname ID values are empty\n",
@@ -187,7 +187,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 26,
+   "execution_count": 7,
    "metadata": {},
    "outputs": [
     {
@@ -211,81 +211,291 @@
        "  <thead>\n",
        "    <tr style=\"text-align: right;\">\n",
        "      <th></th>\n",
+       "      <th>alternateNameId</th>\n",
        "      <th>geonameid</th>\n",
        "      <th>isolanguage</th>\n",
-       "      <th>alt_name</th>\n",
+       "      <th>alternate name</th>\n",
+       "      <th>isPreferredName</th>\n",
+       "      <th>isShortName</th>\n",
+       "      <th>isColloquial</th>\n",
+       "      <th>isHistoric</th>\n",
+       "      <th>from</th>\n",
+       "      <th>to</th>\n",
        "    </tr>\n",
        "  </thead>\n",
        "  <tbody>\n",
        "    <tr>\n",
        "      <th>0</th>\n",
+       "      <td>2181137</td>\n",
        "      <td>3038886</td>\n",
        "      <td>ca</td>\n",
        "      <td>Pic de Tristaina</td>\n",
+       "      <td>1</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>1</th>\n",
+       "      <td>13898832</td>\n",
        "      <td>3038899</td>\n",
        "      <td>ca</td>\n",
        "      <td>Tossalet i Vinyals</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>2</th>\n",
+       "      <td>13898833</td>\n",
        "      <td>3038914</td>\n",
        "      <td>ca</td>\n",
        "      <td>Canal de la Tosa</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>3</th>\n",
+       "      <td>13898834</td>\n",
        "      <td>3038995</td>\n",
        "      <td>ca</td>\n",
        "      <td>Bosc del Solobre</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>4</th>\n",
+       "      <td>13898836</td>\n",
        "      <td>3039037</td>\n",
        "      <td>ca</td>\n",
        "      <td>Solà d’Engordany</td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
+       "      <td></td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
        "</div>"
       ],
       "text/plain": [
-       "   geonameid isolanguage            alt_name\n",
-       "0    3038886          ca    Pic de Tristaina\n",
-       "1    3038899          ca  Tossalet i Vinyals\n",
-       "2    3038914          ca    Canal de la Tosa\n",
-       "3    3038995          ca    Bosc del Solobre\n",
-       "4    3039037          ca    Solà d’Engordany"
+       "   alternateNameId  geonameid isolanguage      alternate name isPreferredName  \\\n",
+       "0          2181137    3038886          ca    Pic de Tristaina               1   \n",
+       "1         13898832    3038899          ca  Tossalet i Vinyals                   \n",
+       "2         13898833    3038914          ca    Canal de la Tosa                   \n",
+       "3         13898834    3038995          ca    Bosc del Solobre                   \n",
+       "4         13898836    3039037          ca    Solà d’Engordany                   \n",
+       "\n",
+       "  isShortName isColloquial isHistoric from to  \n",
+       "0                                              \n",
+       "1                                              \n",
+       "2                                              \n",
+       "3                                              \n",
+       "4                                              "
       ]
      },
-     "execution_count": 26,
+     "execution_count": 7,
      "metadata": {},
      "output_type": "execute_result"
     }
    ],
    "source": [
-    "alname_df_all_values = db.sql(\"\"\"SELECT geonameid, isolanguage, \"alternate name\" as alt_name\n",
+    "alname_df_all_values_imported = db.sql(\"\"\"SELECT *\n",
     "FROM alname_df\n",
     "WHERE geonameid is not null\n",
     "AND isolanguage !=''\n",
-    "AND alt_name !='' \n",
+    "AND \"alternate name\" !='' \n",
     "AND LENGTH(isolanguage) <= 2\n",
     "\"\"\").df()\n",
-    "alname_df_all_values.head()"
+    "alname_df_all_values_imported.head()"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Bringing shortname and preferred name in the isolanguage column."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 10,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# Filter rows where isPreferredName equals 1 (except for all values `en`)\n",
+    "preferred_row = alname_df_all_values_imported[(alname_df_all_values_imported['isPreferredName'] == \"1\") & (alname_df_all_values_imported['isolanguage'] != \"en\")].copy()\n",
+    "\n",
+    "# Update the isolanguage column to 'preferred'\n",
+    "preferred_row['isolanguage'] = 'preferred'\n",
+    "\n",
+    "# Filter rows where isShortName equals 1\n",
+    "shortname_row = alname_df_all_values_imported[alname_df_all_values_imported['isShortName'] == \"1\"].copy()\n",
+    "\n",
+    "# Update the isolanguage column to 'shortname'\n",
+    "shortname_row['isolanguage'] = 'shortname'\n",
+    "\n",
+    "# Concatenate the original DataFrame with the preferred row DataFrame\n",
+    "alname_df_all_values_imported_pref_shortname = pd.concat([alname_df_all_values_imported, preferred_row, shortname_row], ignore_index=True)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 11,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>geonameid</th>\n",
+       "      <th>isolanguage</th>\n",
+       "      <th>alt_name</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>3038886</td>\n",
+       "      <td>ca</td>\n",
+       "      <td>Pic de Tristaina</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>3038899</td>\n",
+       "      <td>ca</td>\n",
+       "      <td>Tossalet i Vinyals</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>3038914</td>\n",
+       "      <td>ca</td>\n",
+       "      <td>Canal de la Tosa</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>3038995</td>\n",
+       "      <td>ca</td>\n",
+       "      <td>Bosc del Solobre</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>3039037</td>\n",
+       "      <td>ca</td>\n",
+       "      <td>Solà d’Engordany</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>7551309</th>\n",
+       "      <td>7729890</td>\n",
+       "      <td>shortname</td>\n",
+       "      <td>North America</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>7551310</th>\n",
+       "      <td>8354411</td>\n",
+       "      <td>shortname</td>\n",
+       "      <td>Soviet Union</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>7551311</th>\n",
+       "      <td>8354411</td>\n",
+       "      <td>shortname</td>\n",
+       "      <td>СССР</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>7551312</th>\n",
+       "      <td>8354411</td>\n",
+       "      <td>shortname</td>\n",
+       "      <td>USSR</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>7551313</th>\n",
+       "      <td>8378500</td>\n",
+       "      <td>shortname</td>\n",
+       "      <td>Belgica</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>7551314 rows × 3 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "         geonameid isolanguage            alt_name\n",
+       "0          3038886          ca    Pic de Tristaina\n",
+       "1          3038899          ca  Tossalet i Vinyals\n",
+       "2          3038914          ca    Canal de la Tosa\n",
+       "3          3038995          ca    Bosc del Solobre\n",
+       "4          3039037          ca    Solà d’Engordany\n",
+       "...            ...         ...                 ...\n",
+       "7551309    7729890   shortname       North America\n",
+       "7551310    8354411   shortname        Soviet Union\n",
+       "7551311    8354411   shortname                СССР\n",
+       "7551312    8354411   shortname                USSR\n",
+       "7551313    8378500   shortname             Belgica\n",
+       "\n",
+       "[7551314 rows x 3 columns]"
+      ]
+     },
+     "execution_count": 11,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "alname_df_all_values = db.sql(\"\"\"SELECT geonameid, isolanguage, \"alternate name\" as alt_name\n",
+    "FROM alname_df_all_values_imported_pref_shortname\n",
+    "\"\"\").df()\n",
+    "alname_df_all_values"
    ]
   },
   {
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Optional Step 1: Taking a look at the top 20 listed languages in the database (Disclaimer in step 3)"
+    "Optional Step: Taking a look at the top languages in the database (Disclaimer in step 3)"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 27,
+   "execution_count": 12,
    "metadata": {},
    "outputs": [
     {
@@ -366,54 +576,79 @@
        "    </tr>\n",
        "    <tr>\n",
        "      <th>10</th>\n",
+       "      <td>preferred</td>\n",
+       "      <td>188012</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>11</th>\n",
        "      <td>fr</td>\n",
        "      <td>152656</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>11</th>\n",
+       "      <th>12</th>\n",
        "      <td>fi</td>\n",
        "      <td>139919</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>12</th>\n",
+       "      <th>13</th>\n",
        "      <td>ko</td>\n",
        "      <td>139003</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>13</th>\n",
+       "      <th>14</th>\n",
        "      <td>uk</td>\n",
        "      <td>126704</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>14</th>\n",
+       "      <th>15</th>\n",
        "      <td>pt</td>\n",
        "      <td>95756</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>15</th>\n",
+       "      <th>16</th>\n",
        "      <td>de</td>\n",
        "      <td>87443</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>16</th>\n",
+       "      <th>17</th>\n",
+       "      <td>shortname</td>\n",
+       "      <td>87329</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>18</th>\n",
        "      <td>hy</td>\n",
        "      <td>77986</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>17</th>\n",
+       "      <th>19</th>\n",
        "      <td>sr</td>\n",
        "      <td>64587</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>18</th>\n",
+       "      <th>20</th>\n",
        "      <td>el</td>\n",
        "      <td>56444</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>19</th>\n",
+       "      <th>21</th>\n",
        "      <td>mk</td>\n",
        "      <td>56342</td>\n",
        "    </tr>\n",
+       "    <tr>\n",
+       "      <th>22</th>\n",
+       "      <td>tr</td>\n",
+       "      <td>54982</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>23</th>\n",
+       "      <td>kk</td>\n",
+       "      <td>52791</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>24</th>\n",
+       "      <td>it</td>\n",
+       "      <td>51753</td>\n",
+       "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
        "</div>"
@@ -430,19 +665,24 @@
        "7           ar     304521\n",
        "8           th     265978\n",
        "9           ja     196185\n",
-       "10          fr     152656\n",
-       "11          fi     139919\n",
-       "12          ko     139003\n",
-       "13          uk     126704\n",
-       "14          pt      95756\n",
-       "15          de      87443\n",
-       "16          hy      77986\n",
-       "17          sr      64587\n",
-       "18          el      56444\n",
-       "19          mk      56342"
+       "10   preferred     188012\n",
+       "11          fr     152656\n",
+       "12          fi     139919\n",
+       "13          ko     139003\n",
+       "14          uk     126704\n",
+       "15          pt      95756\n",
+       "16          de      87443\n",
+       "17   shortname      87329\n",
+       "18          hy      77986\n",
+       "19          sr      64587\n",
+       "20          el      56444\n",
+       "21          mk      56342\n",
+       "22          tr      54982\n",
+       "23          kk      52791\n",
+       "24          it      51753"
       ]
      },
-     "execution_count": 27,
+     "execution_count": 12,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -453,7 +693,7 @@
     "FROM alname_df_all_values\n",
     "GROUP BY isolanguage\n",
     "ORDER BY lng_count DESC\n",
-    "LIMIT 20\n",
+    "LIMIT 25\n",
     "''').df()"
    ]
   },
@@ -461,12 +701,12 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Step 2: Only picking out 10 languages"
+    "Only picking out 10 languages + shortname + preferred"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 114,
+   "execution_count": 13,
    "metadata": {},
    "outputs": [
     {
@@ -498,33 +738,33 @@
        "  <tbody>\n",
        "    <tr>\n",
        "      <th>0</th>\n",
-       "      <td>8210545</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Regans Lagoon</td>\n",
+       "      <td>9089920</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>拿司</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>1</th>\n",
-       "      <td>8210546</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Regents Lake</td>\n",
+       "      <td>9089921</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>素地屋</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>2</th>\n",
-       "      <td>8210547</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Round Lake</td>\n",
+       "      <td>9089923</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>日阿洞</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>3</th>\n",
-       "      <td>8210548</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Lake Ricketson</td>\n",
+       "      <td>9089925</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>白扭洽色</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>4</th>\n",
-       "      <td>8210549</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Ritchies Lagoon</td>\n",
+       "      <td>9089927</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>强波隔勒</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>...</th>\n",
@@ -533,58 +773,58 @@
        "      <td>...</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3815569</th>\n",
-       "      <td>7668943</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Tiger Cave Temple</td>\n",
+       "      <th>4090910</th>\n",
+       "      <td>30521</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>Āl ‘Īsá</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3815570</th>\n",
-       "      <td>7730329</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Khok Kathiam Airport</td>\n",
+       "      <th>4090911</th>\n",
+       "      <td>30521</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>ال عيسى</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3815571</th>\n",
-       "      <td>7730329</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Koke Kathiem Airport</td>\n",
+       "      <th>4090912</th>\n",
+       "      <td>30524</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>الضحاكي</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3815572</th>\n",
-       "      <td>7778911</td>\n",
-       "      <td>en</td>\n",
-       "      <td>James Bond Island</td>\n",
+       "      <th>4090913</th>\n",
+       "      <td>30527</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>Ḩijlān</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3815573</th>\n",
-       "      <td>7793027</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Doi Tao Lake</td>\n",
+       "      <th>4090914</th>\n",
+       "      <td>30530</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>الرومية</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
-       "<p>3815574 rows × 3 columns</p>\n",
+       "<p>4090915 rows × 3 columns</p>\n",
        "</div>"
       ],
       "text/plain": [
-       "         geonameid isolanguage              alt_name\n",
-       "0          8210545          en         Regans Lagoon\n",
-       "1          8210546          en          Regents Lake\n",
-       "2          8210547          en            Round Lake\n",
-       "3          8210548          en        Lake Ricketson\n",
-       "4          8210549          en       Ritchies Lagoon\n",
-       "...            ...         ...                   ...\n",
-       "3815569    7668943          en     Tiger Cave Temple\n",
-       "3815570    7730329          en  Khok Kathiam Airport\n",
-       "3815571    7730329          en  Koke Kathiem Airport\n",
-       "3815572    7778911          en     James Bond Island\n",
-       "3815573    7793027          en          Doi Tao Lake\n",
+       "         geonameid isolanguage alt_name\n",
+       "0          9089920          zh       拿司\n",
+       "1          9089921          zh      素地屋\n",
+       "2          9089923          zh      日阿洞\n",
+       "3          9089925          zh     白扭洽色\n",
+       "4          9089927          zh     强波隔勒\n",
+       "...            ...         ...      ...\n",
+       "4090910      30521          ar  Āl ‘Īsá\n",
+       "4090911      30521          ar  ال عيسى\n",
+       "4090912      30524          ar  الضحاكي\n",
+       "4090913      30527          ar   Ḩijlān\n",
+       "4090914      30530          ar  الرومية\n",
        "\n",
-       "[3815574 rows x 3 columns]"
+       "[4090915 rows x 3 columns]"
       ]
      },
-     "execution_count": 114,
+     "execution_count": 13,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -594,7 +834,7 @@
     "alname_df_all_values_selected = db.sql('''\n",
     "SELECT *\n",
     "FROM alname_df_all_values\n",
-    "WHERE isolanguage in ('zh', 'en', 'es', 'fr', 'ja', 'pt', 'ru', 'de', 'ar', 'ko')\n",
+    "WHERE isolanguage in ('zh', 'en', 'es', 'fr', 'ja', 'pt', 'ru', 'de', 'ar', 'ko', 'shortname', 'preferred')\n",
     "''').df()\n",
     "alname_df_all_values_selected"
    ]
@@ -603,13 +843,13 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Step 3: Taking the first alt name by each language\n",
+    "Taking the first alt name by each language\n",
     "- Geonames have multiple entries for the same language and same location. There could be dozens of alternative names for the same location within the same language."
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 115,
+   "execution_count": 14,
    "metadata": {},
    "outputs": [
     {
@@ -641,33 +881,33 @@
        "  <tbody>\n",
        "    <tr>\n",
        "      <th>0</th>\n",
-       "      <td>650</td>\n",
-       "      <td>ru</td>\n",
-       "      <td>Бастак</td>\n",
+       "      <td>1727</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>معوبرة</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>1</th>\n",
-       "      <td>1816</td>\n",
+       "      <td>1766</td>\n",
        "      <td>ar</td>\n",
-       "      <td>حبات نزال</td>\n",
+       "      <td>خان خيام الوليد</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>2</th>\n",
-       "      <td>2106</td>\n",
+       "      <td>1807</td>\n",
        "      <td>ar</td>\n",
-       "      <td>مطار رشت الدولي</td>\n",
+       "      <td>خشام</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>3</th>\n",
-       "      <td>2254</td>\n",
+       "      <td>1813</td>\n",
        "      <td>ar</td>\n",
-       "      <td>وادي غدير الحمل</td>\n",
+       "      <td>عبود الجدعان</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>4</th>\n",
-       "      <td>2287</td>\n",
+       "      <td>2028</td>\n",
        "      <td>ar</td>\n",
-       "      <td>الفياضية</td>\n",
+       "      <td>درة بیداد العلیا</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>...</th>\n",
@@ -676,58 +916,58 @@
        "      <td>...</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3424813</th>\n",
-       "      <td>12746130</td>\n",
-       "      <td>ko</td>\n",
-       "      <td>인천광역시역사자료관</td>\n",
+       "      <th>3652220</th>\n",
+       "      <td>12740426</td>\n",
+       "      <td>ru</td>\n",
+       "      <td>Bol’shoy Naergen</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3424814</th>\n",
-       "      <td>12746165</td>\n",
-       "      <td>ko</td>\n",
-       "      <td>수산물품관리원인천지원</td>\n",
+       "      <th>3652221</th>\n",
+       "      <td>12746331</td>\n",
+       "      <td>preferred</td>\n",
+       "      <td>桶屋町通り</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3424815</th>\n",
-       "      <td>12746177</td>\n",
-       "      <td>ko</td>\n",
-       "      <td>송학동삼가</td>\n",
+       "      <th>3652222</th>\n",
+       "      <td>12746428</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>鄂城区</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3424816</th>\n",
-       "      <td>12746201</td>\n",
-       "      <td>ko</td>\n",
-       "      <td>한국근대문학관</td>\n",
+       "      <th>3652223</th>\n",
+       "      <td>12746467</td>\n",
+       "      <td>en</td>\n",
+       "      <td>Masjid Mubarak</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>3424817</th>\n",
-       "      <td>12746246</td>\n",
-       "      <td>ja</td>\n",
-       "      <td>しょうふくじちょくしもん</td>\n",
+       "      <th>3652224</th>\n",
+       "      <td>12746811</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>ذا لاين</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
-       "<p>3424818 rows × 3 columns</p>\n",
+       "<p>3652225 rows × 3 columns</p>\n",
        "</div>"
       ],
       "text/plain": [
-       "         geonameid isolanguage         alt_name\n",
-       "0              650          ru           Бастак\n",
-       "1             1816          ar        حبات نزال\n",
-       "2             2106          ar  مطار رشت الدولي\n",
-       "3             2254          ar  وادي غدير الحمل\n",
-       "4             2287          ar         الفياضية\n",
-       "...            ...         ...              ...\n",
-       "3424813   12746130          ko       인천광역시역사자료관\n",
-       "3424814   12746165          ko      수산물품관리원인천지원\n",
-       "3424815   12746177          ko            송학동삼가\n",
-       "3424816   12746201          ko          한국근대문학관\n",
-       "3424817   12746246          ja     しょうふくじちょくしもん\n",
+       "         geonameid isolanguage          alt_name\n",
+       "0             1727          ar            معوبرة\n",
+       "1             1766          ar   خان خيام الوليد\n",
+       "2             1807          ar              خشام\n",
+       "3             1813          ar      عبود الجدعان\n",
+       "4             2028          ar  درة بیداد العلیا\n",
+       "...            ...         ...               ...\n",
+       "3652220   12740426          ru  Bol’shoy Naergen\n",
+       "3652221   12746331   preferred             桶屋町通り\n",
+       "3652222   12746428          zh               鄂城区\n",
+       "3652223   12746467          en    Masjid Mubarak\n",
+       "3652224   12746811          ar           ذا لاين\n",
        "\n",
-       "[3424818 rows x 3 columns]"
+       "[3652225 rows x 3 columns]"
       ]
      },
-     "execution_count": 115,
+     "execution_count": 14,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -749,13 +989,13 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Step 4: Choose English as one of the mandatory listed languages.\n",
+    "Choose English as one of the mandatory listed languages.\n",
     "- If English is not listed for a particular geoname entry, we will not select it."
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 116,
+   "execution_count": 15,
    "metadata": {},
    "outputs": [
     {
@@ -787,33 +1027,33 @@
        "  <tbody>\n",
        "    <tr>\n",
        "      <th>0</th>\n",
-       "      <td>11592844</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Pybus</td>\n",
+       "      <td>12181875</td>\n",
+       "      <td>ru</td>\n",
+       "      <td>Станция Новгород-Северский</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>1</th>\n",
-       "      <td>11593903</td>\n",
+       "      <td>12182202</td>\n",
        "      <td>en</td>\n",
-       "      <td>Southwestern Washington Experiment Station</td>\n",
+       "      <td>Kamkusa Msiska</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>2</th>\n",
-       "      <td>11594363</td>\n",
+       "      <td>12182211</td>\n",
        "      <td>en</td>\n",
-       "      <td>Piana Rocks Lighthouse</td>\n",
+       "      <td>Mwafulirwa Mwambelo</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>3</th>\n",
-       "      <td>11608472</td>\n",
+       "      <td>12182323</td>\n",
        "      <td>en</td>\n",
-       "      <td>Santana do Livramento</td>\n",
+       "      <td>Junju</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>4</th>\n",
-       "      <td>11608475</td>\n",
+       "      <td>12182457</td>\n",
        "      <td>en</td>\n",
-       "      <td>San Pedro Pochutla Airport</td>\n",
+       "      <td>Kanyenda Masanja</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>...</th>\n",
@@ -822,58 +1062,58 @@
        "      <td>...</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>944962</th>\n",
-       "      <td>8556013</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Windarling Mine</td>\n",
+       "      <th>1046753</th>\n",
+       "      <td>6578827</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>第三號隧道</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>944963</th>\n",
-       "      <td>8562582</td>\n",
-       "      <td>en</td>\n",
-       "      <td>Takaiwa Tunnel</td>\n",
+       "      <th>1046754</th>\n",
+       "      <td>6586550</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>Ti-shih-hao Ch’iao</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>944964</th>\n",
-       "      <td>8436037</td>\n",
-       "      <td>es</td>\n",
-       "      <td>Estación de Ronda</td>\n",
+       "      <th>1046755</th>\n",
+       "      <td>6589562</td>\n",
+       "      <td>zh</td>\n",
+       "      <td>省立臺南醫院</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>944965</th>\n",
-       "      <td>8538664</td>\n",
+       "      <th>1046756</th>\n",
+       "      <td>6607371</td>\n",
        "      <td>en</td>\n",
-       "      <td>Mount Kanigan</td>\n",
+       "      <td>Pushkino</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>944966</th>\n",
-       "      <td>8507553</td>\n",
-       "      <td>zh</td>\n",
-       "      <td>黄花农场十一队</td>\n",
+       "      <th>1046757</th>\n",
+       "      <td>6461416</td>\n",
+       "      <td>preferred</td>\n",
+       "      <td>Козма презвитер</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
-       "<p>944967 rows × 3 columns</p>\n",
+       "<p>1046758 rows × 3 columns</p>\n",
        "</div>"
       ],
       "text/plain": [
-       "        geonameid isolanguage                                    alt_name\n",
-       "0        11592844          en                                       Pybus\n",
-       "1        11593903          en  Southwestern Washington Experiment Station\n",
-       "2        11594363          en                      Piana Rocks Lighthouse\n",
-       "3        11608472          en                       Santana do Livramento\n",
-       "4        11608475          en                  San Pedro Pochutla Airport\n",
-       "...           ...         ...                                         ...\n",
-       "944962    8556013          en                             Windarling Mine\n",
-       "944963    8562582          en                              Takaiwa Tunnel\n",
-       "944964    8436037          es                           Estación de Ronda\n",
-       "944965    8538664          en                               Mount Kanigan\n",
-       "944966    8507553          zh                                     黄花农场十一队\n",
+       "         geonameid isolanguage                    alt_name\n",
+       "0         12181875          ru  Станция Новгород-Северский\n",
+       "1         12182202          en              Kamkusa Msiska\n",
+       "2         12182211          en         Mwafulirwa Mwambelo\n",
+       "3         12182323          en                       Junju\n",
+       "4         12182457          en            Kanyenda Masanja\n",
+       "...            ...         ...                         ...\n",
+       "1046753    6578827          zh                       第三號隧道\n",
+       "1046754    6586550          zh          Ti-shih-hao Ch’iao\n",
+       "1046755    6589562          zh                      省立臺南醫院\n",
+       "1046756    6607371          en                    Pushkino\n",
+       "1046757    6461416   preferred             Козма презвитер\n",
        "\n",
-       "[944967 rows x 3 columns]"
+       "[1046758 rows x 3 columns]"
       ]
      },
-     "execution_count": 116,
+     "execution_count": 15,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -895,12 +1135,12 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Optional Step 2: Test how many languages are there for each geoname entry"
+    "Optional Step: Test how many languages are there for each geoname entry"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 155,
+   "execution_count": 16,
    "metadata": {},
    "outputs": [
     {
@@ -931,73 +1171,85 @@
        "  <tbody>\n",
        "    <tr>\n",
        "      <th>0</th>\n",
-       "      <td>10</td>\n",
-       "      <td>4150</td>\n",
+       "      <td>12</td>\n",
+       "      <td>857</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>1</th>\n",
-       "      <td>9</td>\n",
-       "      <td>1650</td>\n",
+       "      <td>11</td>\n",
+       "      <td>1511</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>2</th>\n",
-       "      <td>8</td>\n",
-       "      <td>4334</td>\n",
+       "      <td>10</td>\n",
+       "      <td>2407</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>3</th>\n",
-       "      <td>7</td>\n",
-       "      <td>2545</td>\n",
+       "      <td>9</td>\n",
+       "      <td>4122</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>4</th>\n",
-       "      <td>6</td>\n",
-       "      <td>2666</td>\n",
+       "      <td>8</td>\n",
+       "      <td>2246</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>5</th>\n",
-       "      <td>5</td>\n",
-       "      <td>3839</td>\n",
+       "      <td>7</td>\n",
+       "      <td>2372</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>6</th>\n",
-       "      <td>4</td>\n",
-       "      <td>6798</td>\n",
+       "      <td>6</td>\n",
+       "      <td>2990</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>7</th>\n",
-       "      <td>3</td>\n",
-       "      <td>12548</td>\n",
+       "      <td>5</td>\n",
+       "      <td>4238</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>8</th>\n",
-       "      <td>2</td>\n",
-       "      <td>91567</td>\n",
+       "      <td>4</td>\n",
+       "      <td>18787</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>9</th>\n",
+       "      <td>3</td>\n",
+       "      <td>55159</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>10</th>\n",
+       "      <td>2</td>\n",
+       "      <td>55981</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>11</th>\n",
        "      <td>1</td>\n",
-       "      <td>552969</td>\n",
+       "      <td>532396</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
        "</div>"
       ],
       "text/plain": [
-       "   count_lang  lang_group_count\n",
-       "0          10              4150\n",
-       "1           9              1650\n",
-       "2           8              4334\n",
-       "3           7              2545\n",
-       "4           6              2666\n",
-       "5           5              3839\n",
-       "6           4              6798\n",
-       "7           3             12548\n",
-       "8           2             91567\n",
-       "9           1            552969"
+       "    count_lang  lang_group_count\n",
+       "0           12               857\n",
+       "1           11              1511\n",
+       "2           10              2407\n",
+       "3            9              4122\n",
+       "4            8              2246\n",
+       "5            7              2372\n",
+       "6            6              2990\n",
+       "7            5              4238\n",
+       "8            4             18787\n",
+       "9            3             55159\n",
+       "10           2             55981\n",
+       "11           1            532396"
       ]
      },
-     "execution_count": 155,
+     "execution_count": 16,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -1020,14 +1272,14 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Optional Step 3: Minimum number of required languages\n",
+    "Optional Step: Minimum number of required languages\n",
     "- If you want a tabular output select the max languges in the input language array (which is 10).\n",
     "- Here as an example we can select geonames with more than 5 alt names"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 158,
+   "execution_count": 17,
    "metadata": {},
    "outputs": [
     {
@@ -1059,33 +1311,33 @@
        "  <tbody>\n",
        "    <tr>\n",
        "      <th>0</th>\n",
-       "      <td>895949</td>\n",
-       "      <td>es</td>\n",
-       "      <td>Zambia</td>\n",
+       "      <td>4231976</td>\n",
+       "      <td>shortname</td>\n",
+       "      <td>Worth</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>1</th>\n",
-       "      <td>896140</td>\n",
-       "      <td>pt</td>\n",
-       "      <td>Província Ocidental</td>\n",
+       "      <td>4234477</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>بروكبورت</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>2</th>\n",
-       "      <td>899274</td>\n",
-       "      <td>fr</td>\n",
-       "      <td>Samfya</td>\n",
+       "      <td>4235954</td>\n",
+       "      <td>ar</td>\n",
+       "      <td>مقاطعة كلارك</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>3</th>\n",
-       "      <td>912764</td>\n",
-       "      <td>ja</td>\n",
-       "      <td>カサマ</td>\n",
+       "      <td>4237730</td>\n",
+       "      <td>fr</td>\n",
+       "      <td>Comté d'Effingham</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>4</th>\n",
-       "      <td>921780</td>\n",
-       "      <td>de</td>\n",
-       "      <td>Mohéli</td>\n",
+       "      <td>4247802</td>\n",
+       "      <td>shortname</td>\n",
+       "      <td>Randolph</td>\n",
        "    </tr>\n",
        "    <tr>\n",
        "      <th>...</th>\n",
@@ -1094,58 +1346,58 @@
        "      <td>...</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>144023</th>\n",
-       "      <td>97990</td>\n",
-       "      <td>fr</td>\n",
-       "      <td>Bakouba</td>\n",
+       "      <th>402395</th>\n",
+       "      <td>1835329</td>\n",
+       "      <td>preferred</td>\n",
+       "      <td>대구광역시</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>144024</th>\n",
-       "      <td>119505</td>\n",
+       "      <th>402396</th>\n",
+       "      <td>1839118</td>\n",
        "      <td>en</td>\n",
-       "      <td>Qazvin</td>\n",
+       "      <td>Biyangdo Island</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>144025</th>\n",
-       "      <td>119505</td>\n",
-       "      <td>ko</td>\n",
-       "      <td>카즈빈</td>\n",
+       "      <th>402397</th>\n",
+       "      <td>1855274</td>\n",
+       "      <td>ja</td>\n",
+       "      <td>西蒲原郡</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>144026</th>\n",
-       "      <td>124763</td>\n",
-       "      <td>es</td>\n",
-       "      <td>Markazi</td>\n",
+       "      <th>402398</th>\n",
+       "      <td>1503219</td>\n",
+       "      <td>en</td>\n",
+       "      <td>Kizhi-Aksy</td>\n",
        "    </tr>\n",
        "    <tr>\n",
-       "      <th>144027</th>\n",
-       "      <td>128231</td>\n",
+       "      <th>402399</th>\n",
+       "      <td>2023427</td>\n",
        "      <td>ru</td>\n",
-       "      <td>Керман</td>\n",
+       "      <td>Исток</td>\n",
        "    </tr>\n",
        "  </tbody>\n",
        "</table>\n",
-       "<p>144028 rows × 3 columns</p>\n",
+       "<p>402400 rows × 3 columns</p>\n",
        "</div>"
       ],
       "text/plain": [
-       "        geonameid isolanguage             alt_name\n",
-       "0          895949          es               Zambia\n",
-       "1          896140          pt  Província Ocidental\n",
-       "2          899274          fr               Samfya\n",
-       "3          912764          ja                  カサマ\n",
-       "4          921780          de               Mohéli\n",
-       "...           ...         ...                  ...\n",
-       "144023      97990          fr              Bakouba\n",
-       "144024     119505          en               Qazvin\n",
-       "144025     119505          ko                  카즈빈\n",
-       "144026     124763          es              Markazi\n",
-       "144027     128231          ru               Керман\n",
+       "        geonameid isolanguage           alt_name\n",
+       "0         4231976   shortname              Worth\n",
+       "1         4234477          ar           بروكبورت\n",
+       "2         4235954          ar       مقاطعة كلارك\n",
+       "3         4237730          fr  Comté d'Effingham\n",
+       "4         4247802   shortname           Randolph\n",
+       "...           ...         ...                ...\n",
+       "402395    1835329   preferred              대구광역시\n",
+       "402396    1839118          en    Biyangdo Island\n",
+       "402397    1855274          ja               西蒲原郡\n",
+       "402398    1503219          en         Kizhi-Aksy\n",
+       "402399    2023427          ru              Исток\n",
        "\n",
-       "[144028 rows x 3 columns]"
+       "[402400 rows x 3 columns]"
       ]
      },
-     "execution_count": 158,
+     "execution_count": 17,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -1160,7 +1412,7 @@
     "\tGROUP BY geonameid\n",
     ") t2\n",
     "ON t1.geonameid = t2.geonameid\n",
-    "WHERE t2.count_lang > 4\n",
+    "WHERE t2.count_lang > 2\n",
     "''').df()"
    ]
   },
@@ -1168,15 +1420,123 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Optional Step 4: JSONification of the language and alt_names\n",
+    "Optional Step: JSONification of the language and alt_names\n",
     "- The dictionary represented in a JSON like string"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 18,
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>geonameid</th>\n",
+       "      <th>iso_language_alt_names</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>14</td>\n",
+       "      <td>{\"en\": \"Takht Arreh Do\", \"ar\": \"تخت أرة دو\"}</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>254</td>\n",
+       "      <td>{\"en\": \"Pol-e Bala Rud\", \"ar\": \"جسر بالارود\"}</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>301</td>\n",
+       "      <td>{\"fr\": \"Shahr-e ziba\", \"en\": \"Shahr-e Ziba\"}</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>470</td>\n",
+       "      <td>{\"fr\": \"place Azadi\", \"pt\": \"Praça Azadi\", \"zh...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>566</td>\n",
+       "      <td>{\"de\": \"Ghar-e-Roodafshan\", \"fr\": \"Ghar-e-Rood...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>683061</th>\n",
+       "      <td>12746714</td>\n",
+       "      <td>{\"en\": \"Bosiljevo interchange\"}</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>683062</th>\n",
+       "      <td>12746729</td>\n",
+       "      <td>{\"en\": \"Ringwood Magistrates Court\"}</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>683063</th>\n",
+       "      <td>12746744</td>\n",
+       "      <td>{\"en\": \"Appleton Dock\"}</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>683064</th>\n",
+       "      <td>12746795</td>\n",
+       "      <td>{\"ja\": \"葛城地蔵尊\", \"en\": \"Katsuragi Kṣitigarbha\",...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>683065</th>\n",
+       "      <td>12746811</td>\n",
+       "      <td>{\"de\": \"The Line\", \"en\": \"The Line\", \"ru\": \"Ли...</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>683066 rows × 2 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "        geonameid                             iso_language_alt_names\n",
+       "0              14       {\"en\": \"Takht Arreh Do\", \"ar\": \"تخت أرة دو\"}\n",
+       "1             254      {\"en\": \"Pol-e Bala Rud\", \"ar\": \"جسر بالارود\"}\n",
+       "2             301       {\"fr\": \"Shahr-e ziba\", \"en\": \"Shahr-e Ziba\"}\n",
+       "3             470  {\"fr\": \"place Azadi\", \"pt\": \"Praça Azadi\", \"zh...\n",
+       "4             566  {\"de\": \"Ghar-e-Roodafshan\", \"fr\": \"Ghar-e-Rood...\n",
+       "...           ...                                                ...\n",
+       "683061   12746714                    {\"en\": \"Bosiljevo interchange\"}\n",
+       "683062   12746729               {\"en\": \"Ringwood Magistrates Court\"}\n",
+       "683063   12746744                            {\"en\": \"Appleton Dock\"}\n",
+       "683064   12746795  {\"ja\": \"葛城地蔵尊\", \"en\": \"Katsuragi Kṣitigarbha\",...\n",
+       "683065   12746811  {\"de\": \"The Line\", \"en\": \"The Line\", \"ru\": \"Ли...\n",
+       "\n",
+       "[683066 rows x 2 columns]"
+      ]
+     },
+     "execution_count": 18,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
    "source": [
     "alname_df_all_values_selected_only_first_loc_en_filtered_jsonified  = alname_df_all_values_selected_only_first_loc_en_filtered.groupby('geonameid').apply(lambda x: json.dumps(dict(zip(x['isolanguage'], x['alt_name'])), ensure_ascii=False)).reset_index()\n",
     "alname_df_all_values_selected_only_first_loc_en_filtered_jsonified.columns = ['geonameid', 'iso_language_alt_names']\n",
@@ -1187,20 +1547,19 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Step 6: Converting the dataset in to Python Dictionary for JSON output"
+    "Converting the dataset in to Python Dictionary for JSON output"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 19,
    "metadata": {},
    "outputs": [],
    "source": [
     "alname_df_all_values_selected_only_first_loc_en_filtered_dictionariezed_df  = alname_df_all_values_selected_only_first_loc_en_filtered.groupby('geonameid').apply(lambda x: dict(zip(x['isolanguage'], x['alt_name']))).reset_index()\n",
     "alname_df_all_values_selected_only_first_loc_en_filtered_dictionariezed_df.columns = ['geonameid', 'iso_language_alt_names']\n",
     "\n",
-    "alname_df_all_values_selected_only_first_loc_en_filtered_dict = alname_df_all_values_selected_only_first_loc_en_filtered_dictionariezed_df.set_index('geonameid')['iso_language_alt_names'].to_dict()\n",
-    "alname_df_all_values_selected_only_first_loc_en_filtered_dict"
+    "alname_df_all_values_selected_only_first_loc_en_filtered_dict = alname_df_all_values_selected_only_first_loc_en_filtered_dictionariezed_df.set_index('geonameid')['iso_language_alt_names'].to_dict()"
    ]
   },
   {
@@ -1219,25 +1578,26 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 148,
+   "execution_count": 20,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "|        |   geonameid | isolanguage   | alt_name   |\n",
-      "|-------:|------------:|:--------------|:-----------|\n",
-      "|  63100 |     1269750 | en            | India      |\n",
-      "|  63101 |     1269750 | ko            | 인도       |\n",
-      "| 177456 |     1269750 | ja            | インド     |\n",
-      "| 465842 |     1269750 | pt            | Índia      |\n",
-      "| 562186 |     1269750 | es            | India      |\n",
-      "| 601777 |     1269750 | zh            | 印度       |\n",
-      "| 721371 |     1269750 | ar            | الهند      |\n",
-      "| 810115 |     1269750 | fr            | Inde       |\n",
-      "| 839386 |     1269750 | ru            | Индия      |\n",
-      "| 922130 |     1269750 | de            | Indien     |\n"
+      "|        |   geonameid | isolanguage   | alt_name    |\n",
+      "|-------:|------------:|:--------------|:------------|\n",
+      "|  62447 |     1269750 | fr            | Inde        |\n",
+      "| 111100 |     1269750 | ar            | الهند       |\n",
+      "| 245786 |     1269750 | ru            | Индия       |\n",
+      "| 278989 |     1269750 | es            | Unión India |\n",
+      "| 314823 |     1269750 | zh            | 印度        |\n",
+      "| 444853 |     1269750 | preferred     | Ινδία       |\n",
+      "| 581391 |     1269750 | ja            | インド      |\n",
+      "| 614529 |     1269750 | en            | India       |\n",
+      "| 659641 |     1269750 | ko            | 인도        |\n",
+      "| 817618 |     1269750 | de            | Indien      |\n",
+      "| 993566 |     1269750 | pt            | Índia       |\n"
      ]
     }
    ],
@@ -1254,7 +1614,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 122,
+   "execution_count": 21,
    "metadata": {},
    "outputs": [
     {
@@ -1264,11 +1624,11 @@
        "│ geonameid │                                          iso_language_alt_names                                          │\n",
        "│   int32   │                                                 varchar                                                  │\n",
        "├───────────┼──────────────────────────────────────────────────────────────────────────────────────────────────────────┤\n",
-       "│   1269750 │ {\"en\": \"India\", \"ko\": \"인도\", \"ja\": \"インド\", \"pt\": \"Índia\", \"es\": \"India\", \"zh\": \"印度\", \"ar\": \"الهند…  │\n",
+       "│   1269750 │ {\"fr\": \"Inde\", \"ar\": \"الهند\", \"ru\": \"Индия\", \"es\": \"Unión India\", \"zh\": \"印度\", \"preferred\": \"Ινδία\", …  │\n",
        "└───────────┴──────────────────────────────────────────────────────────────────────────────────────────────────────────┘"
       ]
      },
-     "execution_count": 122,
+     "execution_count": 21,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -1290,25 +1650,26 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 150,
+   "execution_count": 22,
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/plain": [
-       "{'en': 'India',\n",
-       " 'ko': '인도',\n",
-       " 'ja': 'インド',\n",
-       " 'pt': 'Índia',\n",
-       " 'es': 'India',\n",
-       " 'zh': '印度',\n",
+       "{'fr': 'Inde',\n",
        " 'ar': 'الهند',\n",
-       " 'fr': 'Inde',\n",
        " 'ru': 'Индия',\n",
-       " 'de': 'Indien'}"
+       " 'es': 'Unión India',\n",
+       " 'zh': '印度',\n",
+       " 'preferred': 'Ινδία',\n",
+       " 'ja': 'インド',\n",
+       " 'en': 'India',\n",
+       " 'ko': '인도',\n",
+       " 'de': 'Indien',\n",
+       " 'pt': 'Índia'}"
       ]
      },
-     "execution_count": 150,
+     "execution_count": 22,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -1328,7 +1689,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 145,
+   "execution_count": 23,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -1337,7 +1698,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 146,
+   "execution_count": 24,
    "metadata": {},
    "outputs": [],
    "source": [

	geonameid	isolanguage	alt_name
0	3038886	ca	Pic de Tristaina
1	3038899	ca	Tossalet i Vinyals
2	3038914	ca	Canal de la Tosa
3	3038995	ca	Bosc del Solobre
4	3039037	ca	Solà d’Engordany
...	...	...	...
7551309	7729890	shortname	North America
7551310	8354411	shortname	Soviet Union
7551311	8354411	shortname	СССР
7551312	8354411	shortname	USSR
7551313	8378500	shortname	Belgica
	geonameid	iso_language_alt_names
0	14	{\"en\": \"Takht Arreh Do\", \"ar\": \"تخت أرة دو\"}
1	254	{\"en\": \"Pol-e Bala Rud\", \"ar\": \"جسر بالارود\"}
2	301	{\"fr\": \"Shahr-e ziba\", \"en\": \"Shahr-e Ziba\"}
3	470	{\"fr\": \"place Azadi\", \"pt\": \"Praça Azadi\", \"zh...
4	566	{\"de\": \"Ghar-e-Roodafshan\", \"fr\": \"Ghar-e-Rood...
...	...	...
683061	12746714	{\"en\": \"Bosiljevo interchange\"}
683062	12746729	{\"en\": \"Ringwood Magistrates Court\"}
683063	12746744	{\"en\": \"Appleton Dock\"}
683064	12746795	{\"ja\": \"葛城地蔵尊\", \"en\": \"Katsuragi Kṣitigarbha\",...
683065	12746811	{\"de\": \"The Line\", \"en\": \"The Line\", \"ru\": \"Ли...