diff --git a/zhihucrawling/simsun.ttf b/zhihucrawling/simsun.ttf new file mode 100644 index 0000000..e0115ab Binary files /dev/null and b/zhihucrawling/simsun.ttf differ diff --git a/zhihucrawling/zhihucrawlling.ipynb b/zhihucrawling/zhihucrawlling.ipynb new file mode 100644 index 0000000..a027057 --- /dev/null +++ b/zhihucrawling/zhihucrawlling.ipynb @@ -0,0 +1,410 @@ +{ + "cells": [ + { + "cell_type": "code", + "execution_count": 2, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "█\r" + ] + } + ], + "source": [ + "import itchat" + ] + }, + { + "cell_type": "code", + "execution_count": 10, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "\u001b[1m\u001b[36m$RECYCLE.BIN\u001b[m\u001b[m\r\n", + "2020-6-18-Python脚本爬虫.md\r\n", + "\u001b[1m\u001b[36mDesktop\u001b[m\u001b[m\r\n", + "E Book Research Design Cressweell 2014.pdf\r\n", + "GROUP 1 CLASS ACTIVITY 2.docx\r\n", + "GROUP 1 CLASS ACTIVITY1 (1).docx\r\n", + "GROUP 1 CLASS ACTIVITY2.docx\r\n", + "LIU,HONGYANG.mp4\r\n", + "Lab Test (HBase).pdf\r\n", + "\u001b[1m\u001b[36mLiterature Review\u001b[m\u001b[m\r\n", + "Proposal rubric.docx\r\n", + "\u001b[35mRelocated Items\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mResearch Methogologies\u001b[m\u001b[m\r\n", + "Screenshot 2020-02-29 at 14.07.04.png\r\n", + "Screenshot 2020-04-27 at 18.43.15.png\r\n", + "Screenshot 2020-05-20 at 18.46.10.png\r\n", + "Screenshot 2020-05-20 at 18.52.42.png\r\n", + "Screenshot 2020-05-23 at 21.22.07.png\r\n", + "Screenshot 2020-05-31 at 10.42.07.png\r\n", + "Screenshot 2020-06-03 at 19.20.25.png\r\n", + "Screenshot 2020-06-10 at 18.43.44.png\r\n", + "Screenshot 2020-06-10 at 18.43.50.png\r\n", + "\u001b[1m\u001b[36mShData-master\u001b[m\u001b[m\r\n", + "Thumbs.db\r\n", + "Untitled.ipynb\r\n", + "\u001b[1m\u001b[36mbig data management assignment\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mdash-oil-and-gas\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mdash-oil-gas-ternary\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mdash-sample-apps\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mdata mining\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mdata mining期末考试\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mdataMining\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mdbm\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mlatex\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mmachine learning test\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mml project\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mresearch\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mresearch methodology\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mresearch methodology2\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mterminal.app\u001b[m\u001b[m\r\n", + "test_composition.csv\r\n", + "\u001b[1m\u001b[36mtution visa\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mubuntu18\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36mubuntuFile\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36muniversity malaysia\u001b[m\u001b[m\r\n", + "v2-97942ea6f9fb33661fbbec825a550bb9_720w.jpg\r\n", + "\u001b[1m\u001b[36mweka\u001b[m\u001b[m\r\n", + "~$OUP 1 CLASS ACTIVITY 2.docx\r\n", + "~$OUP 1 CLASS ACTIVITY2.docx\r\n", + "~$U,HONGYANG.docx\r\n", + "~$ticle 1.docx\r\n", + "\u001b[1m\u001b[36m作业\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36m数据研发\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36m毕业论文\u001b[m\u001b[m\r\n", + "\u001b[1m\u001b[36m续签材料\u001b[m\u001b[m\r\n" + ] + } + ], + "source": [ + "!ls" + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": {}, + "outputs": [], + "source": [ + "from DecryptLogin import login" + ] + }, + { + "cell_type": "code", + "execution_count": 5, + "metadata": {}, + "outputs": [], + "source": [ + "lg = login.Login()" + ] + }, + { + "cell_type": "code", + "execution_count": 1, + "metadata": {}, + "outputs": [ + { + "ename": "NameError", + "evalue": "name 'lg' is not defined", + "output_type": "error", + "traceback": [ + "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m", + "\u001b[0;31mNameError\u001b[0m Traceback (most recent call last)", + "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0minfos_return\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0msession\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mlg\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mzhihu\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m\"xxx\"\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;34m\"xxx\"\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;34m'pc'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m", + "\u001b[0;31mNameError\u001b[0m: name 'lg' is not defined" + ] + } + ], + "source": [ + "infos_return, session = lg.zhihu(\"xxx\",\"xxx\", 'pc')" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": {}, + "outputs": [], + "source": [ + "import re, json, random, requests, urllib3\n", + "from bs4 import BeautifulSoup\n", + "url = \"https://www.zhihu.com/question/34098079\"\n", + "\n", + "headers = {\n", + " \"User-Agent\": \"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36\",\n", + " }\n", + "\n", + "\n", + "\n", + "resp = requests.get(url,headers=headers)\n", + "\n", + "# soup = BeautifulSoup(resp.text,'lxml')\n", + "\n", + "\n", + "\n", + "\n", + "\n", + "soup = BeautifulSoup(resp.text,'lxml')\n", + "\n", + "text = soup.find('div',{'id':'QuestionAnswers-answers'}).find_all('div',{'class':'List-item'})\n", + "\n" + ] + }, + { + "cell_type": "code", + "execution_count": 46, + "metadata": {}, + "outputs": [], + "source": [ + "for i in text:\n", + " content=i.find_all('p')\n" + ] + }, + { + "cell_type": "code", + "execution_count": 51, + "metadata": {}, + "outputs": [], + "source": [ + "pattern =re.compile(u\"[\\u4e00-\\u9fa5]+\")\n" + ] + }, + { + "cell_type": "code", + "execution_count": 73, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "还能一键扣图,让开淘宝店的设计师下岗,在一旁痛哭流涕……\n", + "\n", + "\n", + "再也不用担心工作忙,没法经常和她/他/它聊天了。\n", + "可以实时知道女友的情感情绪指数,再也不用担心女友莫名其妙生气了。\n", + "还能顺道教女朋友学英语(女朋友一定很惊喜)\n", + "为了方便快速开发,我们使用python中的wxpy模块完成微信的基本操作。\n", + "首先,我们设置一个config.ini配置文件,并从这个配置文件开始读取信息。这些参数一看就懂,所以无需多言。\n", + "设置完相关参数以后,我们再来学习一下,如何每天教女友学英语:\n", + "如果你愿意,可以在上面对时间的判断中,加入一些其他你想要的,这样你女友就更开心啦!后期如果有时间,我将会加上以上节日问候功能。\n", + "接着,开启微信机器人,为了程序的健壮性,自动判断一下操作系统,根据不同操作系统执行不同指令:\n", + "只有每天的问候和节日问候是仅仅不够的,我们必须时刻知道她的情绪指数,这里可以使用snowNlp或者jieba来做分析,但是为了能够在打包成exe可执行文件时使得程序尽可能小,我们采取直接调用接口的方式来做。代码如下:\n", + "教完女友学英语后,开始把我们的关心语发给她。这里涉及到wxpy模块的相关操作,很简单,看我的例子就会了:\n", + "最后,就是如何每天定时发关心语给女友的问题了。\n", + "首先来个while循环,365天无限关心\n", + "最后,输入以下代码开始守护女友模式吧~\n", + "pip安装下列包:\n", + "设置以下内容:\n", + "至于没有女朋友的……\n", + "要不考虑一下它\n", + "这张逼死淘宝专业抠图店家的照片,用3行Python代码,花5秒就能超高精度抠图。\n", + "这里的 API 接口来源于 Remove.bg 网站,一个邮箱账号可以申请一个免费接口,可处理 50 张照片,如果想处理更多或者生成高清照片,需要买套餐,算下来价格大概是 1 元一张。\n", + "上淘宝搜索「证件照换底色」的店铺,发现多数店铺收费是 5 元,觉得利用好价格差空间,应该有商机。\n", + "接着比较感兴趣淘宝店家是怎么抠图的,抠图的质量如何,于是选择了排名前两位的店家来做测试,跟掌柜开始了一段「套路」聊天。\n", + "先找了第一家店主,店主上来就说先发照片,抠图满意再付款,于是就发了文章开头那张比较难抠的一张,想看看他们水平怎么样:\n", + "没想到店主这一抠就是二十分钟。。。\n", + "满心期待地打开图片一看,头发丝抠的不好,照片色彩也变了:\n", + "跟第二家店掌柜聊了后,也是花了 16 分钟弄好,比第一家稍好一点:\n", + "把三幅图一对比,从头发丝抠的效果和照片的色彩还原度就可以看出还是 AI 效果最好,而且只需要 5 秒钟。\n", + "于是,大致可以总结这款 AI 工具从效果和效率上基本碾压手动 PS 的淘宝店家。\n", + "心疼掌柜,花了 20 分钟还没有拿下我这一单……\n", + "这么难抠的图 AI 工具效果都好,那简单的证件照应该更没问题,基本确定有商机。\n", + "\n", + "\n", + "\n", + "\n", + "接下来用 Python 把上面的代码进行完善打包成 exe 文件执行。\n", + "轻松实现这样的功能:只需要简单敲几下键盘,就可以随意批量更换照片的背景色(常见的白、蓝、红三种颜色),然后秒换背景出图。\n", + "效果如下:\n", + "具体实现很简单,第一步输入 API,第二步输入图片所在文件夹,接着程序就会先抠图,生成带透明背景的 PNG 格式图形。 \n", + "接下来第三步利用 PIL 库来设置图片的背景颜色,键入一个字母就可以秒生成对应的背景色证件照。\n", + "这样就做成了一个简单的证件照更换工具,拿去开个淘宝店和抠图的设计师抢饭吃没有压力……\n", + "估计打死店主也都想不到让自己下岗的是几行代码……效率还是自己的N倍……\n", + "此工具可关注公众号“七月在线实验室”后,发“证件照”获取。\n", + "\n", + "看完这篇内容后,相信以下三件事,也会对你的个人提升有所帮助:\n", + "1、点赞,让更多人能看到这篇内容,同时你的认可也会鼓励我创作更多优质内容。\n", + "2、让自己变的更强:七月在线推出【Python基础特训4】,高中生都能学会的Python基础课程,限时优惠!并赠送150页python基础文档还等什么点击下方开始学习吧!\n", + "关注微信公众号 【七月在线实验室】,让自己变得更强!在公众号内发“ZH”。即可获得BAT面试题100道和课程代金劵!\n", + "\n" + ] + } + ], + "source": [ + "for i in content:\n", + " print(i.text)" + ] + }, + { + "cell_type": "code", + "execution_count": 64, + "metadata": {}, + "outputs": [], + "source": [ + "text=\"\"\n", + "for i in content:\n", + " text=text+i.text\n" + ] + }, + { + "cell_type": "code", + "execution_count": 69, + "metadata": {}, + "outputs": [ + { + "name": "stdout", + "output_type": "stream", + "text": [ + "Populating the interactive namespace from numpy and matplotlib\n" + ] + }, + { + "data": { + "text/plain": [ + "(-0.5, 399.5, 199.5, -0.5)" + ] + }, + "execution_count": 69, + "metadata": {}, + "output_type": "execute_result" + }, + { + "data": { + "image/png": "\n", + "text/plain": [ + "
" + ] + }, + "metadata": { + "needs_background": "light" + }, + "output_type": "display_data" + } + ], + "source": [ + "from wordcloud import WordCloud\n", + "wordcloud = WordCloud(font_path=\"simsun.ttf\").generate(mytext)\n", + "%pylab inline\n", + "import matplotlib.pyplot as plt\n", + "plt.imshow(wordcloud, interpolation='bilinear')\n", + "plt.axis(\"off\")" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] + }, + { + "cell_type": "code", + "execution_count": 8, + "metadata": {}, + "outputs": [], + "source": [ + "def get_answers_by_page(topic_id, page_no):\n", + " global db, answer_ids, maxnum\n", + " limit = 10\n", + " offset = page_no * limit\n", + " url = \"https://www.zhihu.com/api/v4/topics/\" + str(\n", + " topic_id) + \"/feeds/essence?include=data%5B%3F(target.type%3Dtopic_sticky_module)%5D.target.data%5B%3F(target.type%3Danswer)%5D.target.content%2Crelationship.is_authorized%2Cis_author%2Cvoting%2Cis_thanked%2Cis_nothelp%3Bdata%5B%3F(target.type%3Dtopic_sticky_module)%5D.target.data%5B%3F(target.type%3Danswer)%5D.target.is_normal%2Ccomment_count%2Cvoteup_count%2Ccontent%2Crelevant_info%2Cexcerpt.author.badge%5B%3F(type%3Dbest_answerer)%5D.topics%3Bdata%5B%3F(target.type%3Dtopic_sticky_module)%5D.target.data%5B%3F(target.type%3Darticle)%5D.target.content%2Cvoteup_count%2Ccomment_count%2Cvoting%2Cauthor.badge%5B%3F(type%3Dbest_answerer)%5D.topics%3Bdata%5B%3F(target.type%3Dtopic_sticky_module)%5D.target.data%5B%3F(target.type%3Dpeople)%5D.target.answer_count%2Carticles_count%2Cgender%2Cfollower_count%2Cis_followed%2Cis_following%2Cbadge%5B%3F(type%3Dbest_answerer)%5D.topics%3Bdata%5B%3F(target.type%3Danswer)%5D.target.annotation_detail%2Ccontent%2Crelationship.is_authorized%2Cis_author%2Cvoting%2Cis_thanked%2Cis_nothelp%3Bdata%5B%3F(target.type%3Danswer)%5D.target.author.badge%5B%3F(type%3Dbest_answerer)%5D.topics%3Bdata%5B%3F(target.type%3Darticle)%5D.target.annotation_detail%2Ccontent%2Cauthor.badge%5B%3F(type%3Dbest_answerer)%5D.topics%3Bdata%5B%3F(target.type%3Dquestion)%5D.target.annotation_detail%2Ccomment_count&limit=\" + str(\n", + " limit) + \"&offset=\" + str(offset)\n", + " headers = {\n", + " \"User-Agent\": \"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36\",\n", + " }\n", + " try:\n", + " r = requests.get(url, verify=False, headers=headers)\n", + " except requests.exceptions.ConnectionError:\n", + " return False\n", + " content = r.content.decode(\"utf-8\")\n", + " data = json.loads(content)\n", + " is_end = data[\"paging\"][\"is_end\"]\n", + " items = data[\"data\"]\n", + " if len(items) <= 0:\n", + " return True\n", + " pre = re.compile(\">(.*?)<\")\n", + " for item in items:\n", + " if maxnum <= 0:\n", + " return True\n", + " answer_id = item[\"target\"][\"id\"]\n", + " if answer_id in answer_ids:\n", + " continue\n", + " if item[\"target\"][\"type\"] != \"answer\":\n", + " continue\n", + " if int(item[\"target\"][\"voteup_count\"]) < 10000:\n", + " continue\n", + " answer = ''.join(pre.findall(item[\"target\"][\"content\"].replace(\"\\n\", \"\").replace( \" \" , \"\")))\n", + " if len(answer) == 0:\n", + " continue\n", + " if len(answer) > 200:\n", + " continue\n", + " answer_ids.append(answer_id)\n", + " question = item[\"target\"][\"question\"][\"title\"].replace(\"\\n\", \"\")\n", + " vote_num = item[\"target\"][\"voteup_count\"]\n", + " if answer.find(\"<\") > -1 and answer.find(\">\") > -1:\n", + " pass\n", + " sline = \"=\" * 50\n", + " content = sline + \"\\nQ: {}\\nA: {}\\nvote: {}\\n\".format(question, answer, vote_num)\n", + " print(content)\n", + " save2file(content)\n", + " maxnum -= 1\n", + " return is_end" + ] + }, + { + "cell_type": "code", + "execution_count": 9, + "metadata": {}, + "outputs": [], + "source": [ + "def save2file(content):\n", + " with open('result', 'a', encoding='utf-8') as file:\n", + " file.write(content)" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.7.3" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} diff --git "a/\345\244\247\344\274\227\347\202\271\350\257\204/02-\350\256\241\347\247\2211606-\346\235\250\350\212\263\350\212\263-\345\274\200\351\242\230\346\212\245\345\221\212-\346\217\220\344\272\244\347\211\210.pdf" "b/\345\244\247\344\274\227\347\202\271\350\257\204/02-\350\256\241\347\247\2211606-\346\235\250\350\212\263\350\212\263-\345\274\200\351\242\230\346\212\245\345\221\212-\346\217\220\344\272\244\347\211\210.pdf" new file mode 100755 index 0000000..32adec6 Binary files /dev/null and "b/\345\244\247\344\274\227\347\202\271\350\257\204/02-\350\256\241\347\247\2211606-\346\235\250\350\212\263\350\212\263-\345\274\200\351\242\230\346\212\245\345\221\212-\346\217\220\344\272\244\347\211\210.pdf" differ diff --git "a/\345\244\247\344\274\227\347\202\271\350\257\204/Dz_shopdetails.py" "b/\345\244\247\344\274\227\347\202\271\350\257\204/Dz_shopdetails.py" new file mode 100755 index 0000000..4439ffa --- /dev/null +++ "b/\345\244\247\344\274\227\347\202\271\350\257\204/Dz_shopdetails.py" @@ -0,0 +1,424 @@ +import os +import urllib +from bs4 import BeautifulSoup +from fontTools.ttLib import TTFont +import requests +import time +import numpy as pd +import pandas as pd +from pandas import DataFrame + + + +''' +df = pd.DataFrame(pd.read_excel( './data/beijing/beijing.xlsx',sheet_name ='大众点评餐厅信息')) +shopURL = df['shopURL'] +#df['Tele']= None +#df.insert(3,'Tele',None) +for i in range(0,5): + df.iloc[i,3] = 1 +DataFrame(df).to_excel('./data/beijing/beijing.xlsx',sheet_name ='大众点评餐厅信息',index=False, header=True) +''' + +def get_Shopdetails(font_name_tel,font_name_time,font_name_dish): + #获取已爬取的shopurl + df = pd.DataFrame(pd.read_excel('./data/beijing/beijing.xlsx', sheet_name='大众点评餐厅信息')) + shopURL = df['shopURL'] + shopid_list = df['shop_id'] + #修改插入值 + df.insert(3, 'Tele', None) + df.insert(4, 'Time', None) + for i in range(len(shopURL)): + time.sleep(40) + url = shopURL[i] + shopid = shopid_list[i] + headers = { + 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9', + 'Accept-Encoding': 'gzip, deflate', + 'Accept-Language': 'zh-CN,zh;q=0.9', + 'Connection': 'keep-alive', + "Cookie": 's_ViewType=10; _lxsdk_cuid=16fa87fc490c8-02426df1c4ac71-6701b35-144000-16fa87fc491c8; _lxsdk=16fa87fc490c8-02426df1c4ac71-6701b35-144000-16fa87fc491c8; _hc.v=e341e466-9834-a0f5-107b-9fdab1b34191.1579079944; ua=Daisy._620; ctu=d465b1dcc3f659856cf30445bbdb5b7325f916625944c0eda4a4e09ab5c3dc95; cityid=341; switchcityflashtoast=1; default_ab=index%3AA%3A3%7CshopList%3AC%3A5; dplet=63b9a755291eec6e054067fdf1d6842b; dper=7c5d01df3117bf3d570e5b81af787981fa361e78dc792a941622ce17921ba5378670a472fa2c5b2fac712fff4394b541a9c5ef1545188b7744a47cd0139069c27d09701ca681e46e40e04145b54eb0c46981b154f3182aaadacc9c5c52e20048; _lx_utm=utm_source%3DBaidu%26utm_medium%3Dorganic; cy=2; cye=beijing; ll=7fd06e815b796be3df069dec7836c3df; _lxsdk_s=171073f9ee5-65f-7a7-038%7C%7C282', + 'Host': 'www.dianping.com', + 'If-Modified-Since': 'Mon, 23 Mar 2020 05:11:12 GMT', + 'If-None-Match': "6d7f33e3ecead2ca33bd5e1d99b0f990", + 'Referer': 'http://www.dianping.com/beijing/ch10', + 'Upgrade-Insecure-Requests': '1', + 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36' + } + html = requests.get(url, headers = headers).text + + #对加密文本进行解码 + for code, value in font_name_tel.items(): + code_str = code + text = value + # 再在html文本中进行对比,如果文本中的编码字符与字典中的解码字符一致,就进行替换 + if code_str in html: + html = html.replace(code_str, text) + + for code, value in font_name_hour.items(): + code_str = code + text = value + # 再在html文本中进行对比,如果文本中的编码字符与字典中的解码字符一致,就进行替换 + if code_str in html: + html = html.replace(code_str, text) + + for code, value in font_name_dish.items(): + code_str = code + text = value + # 再在html文本中进行对比,如果文本中的编码字符与字典中的解码字符一致,就进行替换 + if code_str in html: + html = html.replace(code_str, text) + ''' + #创建餐厅文件,存储推荐菜名称、图片 + shop_path = "./data/beijing/" + str(shopid) + '/' + if not os.path.exists(shop_path): + os.makedirs(shop_path) + dish_img = shop_path + '/' + 'Re-dish' + '/' + if not os.path.exists(dish_img): + os.makedirs(dish_img) + + #创建CSV文件,存储推荐菜名称 + re_dish_File = open(shop_path +'/dishname.csv','w+') + ''' + try: + #对网页进行解析,提取需要的数据 + bs = BeautifulSoup(html, 'lxml') + basic_info = bs.find('div', class_='main') + tel = basic_info.find('p', class_= 'expand-info tel').get_text() + print(tel) + btime = basic_info.find('p', class_='info info-indent').find('span',class_='item').get_text() + print(btime) + df.iloc[i, 3] = tel + df.iloc[i,4] = btime + + #推荐菜 + + Re_img = basic_info.find('ul', class_='recommend-photo clearfix').find('img').get('src') + + + ''' + for f in range(len(Re_dish_name)): + urllib.request.urlretrieve(Re_img_url[f], r'./' + shopid +'%s.jpd' % Re_dish_name[f]) + print(Re_dish_name,Re_img_url) + + writer = csv.writer(re_dish_File) + for f in range(len(Re_dish_name)): + writer.writerow(f) + urllib.request.urlretrieve(Re_img_url[f], r'./' + dish_img + '%s.jpd' % Re_dish_name[f]) + + re_dish_File.close() + + ''' + #营业时间 + except: + continue + + DataFrame(df).to_excel('./data/beijing/beijing.xlsx',sheet_name ='大众点评餐厅信息',index=False, header=True) + + +def get_fonttel(): + font_t = TTFont('./woff/b24aae10.woff') + font_names_t = font_t.getGlyphOrder() + text_t = ['', '', '1', '2', '3', '4', '5', '6', '7', '8', + '9', '0', '店', '中', '美', '家', '馆', '小', '车', '大', + '市', '公', '酒', '行', '国', '品', '发', '电', '金', '心', + '业', '商', '司', '超', '生', '装', '园', '场', '食', '有', + '新', '限', '天', '面', '工', '服', '海', '华', '水', '房', + '饰', '城', '乐', '汽', '香', '部', '利', '子', '老', '艺', + '花', '专', '东', '肉', '菜', '学', '福', '饭', '人', '百', + '餐', '茶', '务', '通', '味', '所', '山', '区', '门', '药', + '银', '农', '龙', '停', '尚', '安', '广', '鑫', '一', '容', + '动', '南', '具', '源', '兴', '鲜', '记', '时', '机', '烤', + '文', '康', '信', '果', '阳', '理', '锅', '宝', '达', '地', + '儿', '衣', '特', '产', '西', '批', '坊', '州', '牛', '佳', + '化', '五', '米', '修', '爱', '北', '养', '卖', '建', '材', + '三', '会', '鸡', '室', '红', '站', '德', '王', '光', '名', + '丽', '油', '院', '堂', '烧', '江', '社', '合', '星', '货', + '型', '村', '自', '科', '快', '便', '日', '民', '营', '和', + '活', '童', '明', '器', '烟', '育', '宾', '精', '屋', '经', + '居', '庄', '石', '顺', '林', '尔', '县', '手', '厅', '销', + '用', '好', '客', '火', '雅', '盛', '体', '旅', '之', '鞋', + '辣', '作', '粉', '包', '楼', '校', '鱼', '平', '彩', '上', + '吧', '保', '永', '万', '物', '教', '吃', '设', '医', '正', + '造', '丰', '健', '点', '汤', '网', '庆', '技', '斯', '洗', + '料', '配', '汇', '木', '缘', '加', '麻', '联', '卫', '川', + '泰', '色', '世', '方', '寓', '风', '幼', '羊', '烫', '来', + '高', '厂', '兰', '阿', '贝', '皮', '全', '女', '拉', '成', + '云', '维', '贸', '道', '术', '运', '都', '口', '博', '河', + '瑞', '宏', '京', '际', '路', '祥', '青', '镇', '厨', '培', + '力', '惠', '连', '马', '鸿', '钢', '训', '影', '甲', '助', + '窗', '布', '富', '牌', '头', '四', '多', '妆', '吉', '苑', + '沙', '恒', '隆', '春', '干', '饼', '氏', '里', '二', '管', + '诚', '制', '售', '嘉', '长', '轩', '杂', '副', '清', '计', + '黄', '讯', '太', '鸭', '号', '街', '交', '与', '叉', '附', + '近', '层', '旁', '对', '巷', '栋', '环', '省', '桥', '湖', + '段', '乡', '厦', '府', '铺', '内', '侧', '元', '购', '前', + '幢', '滨', '处', '向', '座', '下', '県', '凤', '港', '开', + '关', '景', '泉', '塘', '放', '昌', '线', '湾', '政', '步', + '宁', '解', '白', '田', '町', '溪', '十', '八', '古', '双', + '胜', '本', '单', '同', '九', '迎', '第', '台', '玉', '锦', + '底', '后', '七', '斜', '期', '武', '岭', '松', '角', '纪', + '朝', '峰', '六', '振', '珠', '局', '岗', '洲', '横', '边', + '济', '井', '办', '汉', '代', '临', '弄', '团', '外', '塔', + '杨', '铁', '浦', '字', '年', '岛', '陵', '原', '梅', '进', + '荣', '友', '虹', '央', '桂', '沿', '事', '津', '凯', '莲', + '丁', '秀', '柳', '集', '紫', '旗', '张', '谷', '的', '是', + '不', '了', '很', '还', '个', '也', '这', '我', '就', '在', + '以', '可', '到', '错', '没', '去', '过', '感', '次', '要', + '比', '觉', '看', '得', '说', '常', '真', '们', '但', '最', + '喜', '哈', '么', '别', '位', '能', '较', '境', '非', '为', + '欢', '然', '他', '挺', '着', '价', '那', '意', '种', '想', + '出', '员', '两', '推', '做', '排', '实', '分', '间', '甜', + '度', '起', '满', '给', '热', '完', '格', '荐', '喝', '等', + '其', '再', '几', '只', '现', '朋', '候', '样', '直', '而', + '买', '于', '般', '豆', '量', '选', '奶', '打', '每', '评', + '少', '算', '又', '因', '情', '找', '些', '份', '置', '适', + '什', '蛋', '师', '气', '你', '姐', '棒', '试', '总', '定', + '啊', '足', '级', '整', '带', '虾', '如', '态', '且', '尝', + '主', '话', '强', '当', '更', '板', '知', '己', '无', '酸', + '让', '入', '啦', '式', '笑', '赞', '片', '酱', '差', '像', + '提', '队', '走', '嫩', '才', '刚', '午', '接', '重', '串', + '回', '晚', '微', '周', '值', '费', '性', '桌', '拍', '跟', + '块', '调', '糕' + ] + # 然后我们创建一个font_name的字典,用来装字体编码和 --> 所对应的数字、汉字 + font_name_tel = {} + for index,value in enumerate(text_t): + # 这就是大众点评乱码的结构:由前面的三个字符‘&#x’+后面是小写字母和数字+分号‘;’ + t = font_names_t[index].replace('uni', '&#x').lower() + ';' + # 下面生成的这个就是乱码,他就对应刚刚字体文件的对应数字,可以运行看看 + font_name_tel[t] = value + + return font_name_tel + +def get_fonttime(): + font_d = TTFont('./woff/45ab0ca2.woff') + font_names_d = font_d.getGlyphOrder() + text_d = ['', '', '1', '2', '3', '4', '5', '6', '7', '8', + '9', '0', '店', '中', '美', '家', '馆', '小', '车', '大', + '市', '公', '酒', '行', '国', '品', '发', '电', '金', '心', + '业', '商', '司', '超', '生', '装', '园', '场', '食', '有', + '新', '限', '天', '面', '工', '服', '海', '华', '水', '房', + '饰', '城', '乐', '汽', '香', '部', '利', '子', '老', '艺', + '花', '专', '东', '肉', '菜', '学', '福', '饭', '人', '百', + '餐', '茶', '务', '通', '味', '所', '山', '区', '门', '药', + '银', '农', '龙', '停', '尚', '安', '广', '鑫', '一', '容', + '动', '南', '具', '源', '兴', '鲜', '记', '时', '机', '烤', + '文', '康', '信', '果', '阳', '理', '锅', '宝', '达', '地', + '儿', '衣', '特', '产', '西', '批', '坊', '州', '牛', '佳', + '化', '五', '米', '修', '爱', '北', '养', '卖', '建', '材', + '三', '会', '鸡', '室', '红', '站', '德', '王', '光', '名', + '丽', '油', '院', '堂', '烧', '江', '社', '合', '星', '货', + '型', '村', '自', '科', '快', '便', '日', '民', '营', '和', + '活', '童', '明', '器', '烟', '育', '宾', '精', '屋', '经', + '居', '庄', '石', '顺', '林', '尔', '县', '手', '厅', '销', + '用', '好', '客', '火', '雅', '盛', '体', '旅', '之', '鞋', + '辣', '作', '粉', '包', '楼', '校', '鱼', '平', '彩', '上', + '吧', '保', '永', '万', '物', '教', '吃', '设', '医', '正', + '造', '丰', '健', '点', '汤', '网', '庆', '技', '斯', '洗', + '料', '配', '汇', '木', '缘', '加', '麻', '联', '卫', '川', + '泰', '色', '世', '方', '寓', '风', '幼', '羊', '烫', '来', + '高', '厂', '兰', '阿', '贝', '皮', '全', '女', '拉', '成', + '云', '维', '贸', '道', '术', '运', '都', '口', '博', '河', + '瑞', '宏', '京', '际', '路', '祥', '青', '镇', '厨', '培', + '力', '惠', '连', '马', '鸿', '钢', '训', '影', '甲', '助', + '窗', '布', '富', '牌', '头', '四', '多', '妆', '吉', '苑', + '沙', '恒', '隆', '春', '干', '饼', '氏', '里', '二', '管', + '诚', '制', '售', '嘉', '长', '轩', '杂', '副', '清', '计', + '黄', '讯', '太', '鸭', '号', '街', '交', '与', '叉', '附', + '近', '层', '旁', '对', '巷', '栋', '环', '省', '桥', '湖', + '段', '乡', '厦', '府', '铺', '内', '侧', '元', '购', '前', + '幢', '滨', '处', '向', '座', '下', '県', '凤', '港', '开', + '关', '景', '泉', '塘', '放', '昌', '线', '湾', '政', '步', + '宁', '解', '白', '田', '町', '溪', '十', '八', '古', '双', + '胜', '本', '单', '同', '九', '迎', '第', '台', '玉', '锦', + '底', '后', '七', '斜', '期', '武', '岭', '松', '角', '纪', + '朝', '峰', '六', '振', '珠', '局', '岗', '洲', '横', '边', + '济', '井', '办', '汉', '代', '临', '弄', '团', '外', '塔', + '杨', '铁', '浦', '字', '年', '岛', '陵', '原', '梅', '进', + '荣', '友', '虹', '央', '桂', '沿', '事', '津', '凯', '莲', + '丁', '秀', '柳', '集', '紫', '旗', '张', '谷', '的', '是', + '不', '了', '很', '还', '个', '也', '这', '我', '就', '在', + '以', '可', '到', '错', '没', '去', '过', '感', '次', '要', + '比', '觉', '看', '得', '说', '常', '真', '们', '但', '最', + '喜', '哈', '么', '别', '位', '能', '较', '境', '非', '为', + '欢', '然', '他', '挺', '着', '价', '那', '意', '种', '想', + '出', '员', '两', '推', '做', '排', '实', '分', '间', '甜', + '度', '起', '满', '给', '热', '完', '格', '荐', '喝', '等', + '其', '再', '几', '只', '现', '朋', '候', '样', '直', '而', + '买', '于', '般', '豆', '量', '选', '奶', '打', '每', '评', + '少', '算', '又', '因', '情', '找', '些', '份', '置', '适', + '什', '蛋', '师', '气', '你', '姐', '棒', '试', '总', '定', + '啊', '足', '级', '整', '带', '虾', '如', '态', '且', '尝', + '主', '话', '强', '当', '更', '板', '知', '己', '无', '酸', + '让', '入', '啦', '式', '笑', '赞', '片', '酱', '差', '像', + '提', '队', '走', '嫩', '才', '刚', '午', '接', '重', '串', + '回', '晚', '微', '周', '值', '费', '性', '桌', '拍', '跟', + '块', '调', '糕' + ] + # 然后我们创建一个font_name的字典,用来装字体编码和 --> 所对应的数字、汉字 + font_name_time = {} + for index,value in enumerate(text_d): + # 这就是大众点评乱码的结构:由前面的三个字符‘&#x’+后面是小写字母和数字+分号‘;’ + t = font_names_d[index].replace('uni', '&#x').lower() + ';' + # 下面生成的这个就是乱码,他就对应刚刚字体文件的对应数字,可以运行看看 + font_name_time[t] = value + + return font_name_time + +def get_fonthour(): + font_h = TTFont('./woff/45ab0ca2.woff') + font_names_h = font_h.getGlyphOrder() + text_h = ['', '', '1', '2', '3', '4', '5', '6', '7', '8', + '9', '0', '店', '中', '美', '家', '馆', '小', '车', '大', + '市', '公', '酒', '行', '国', '品', '发', '电', '金', '心', + '业', '商', '司', '超', '生', '装', '园', '场', '食', '有', + '新', '限', '天', '面', '工', '服', '海', '华', '水', '房', + '饰', '城', '乐', '汽', '香', '部', '利', '子', '老', '艺', + '花', '专', '东', '肉', '菜', '学', '福', '饭', '人', '百', + '餐', '茶', '务', '通', '味', '所', '山', '区', '门', '药', + '银', '农', '龙', '停', '尚', '安', '广', '鑫', '一', '容', + '动', '南', '具', '源', '兴', '鲜', '记', '时', '机', '烤', + '文', '康', '信', '果', '阳', '理', '锅', '宝', '达', '地', + '儿', '衣', '特', '产', '西', '批', '坊', '州', '牛', '佳', + '化', '五', '米', '修', '爱', '北', '养', '卖', '建', '材', + '三', '会', '鸡', '室', '红', '站', '德', '王', '光', '名', + '丽', '油', '院', '堂', '烧', '江', '社', '合', '星', '货', + '型', '村', '自', '科', '快', '便', '日', '民', '营', '和', + '活', '童', '明', '器', '烟', '育', '宾', '精', '屋', '经', + '居', '庄', '石', '顺', '林', '尔', '县', '手', '厅', '销', + '用', '好', '客', '火', '雅', '盛', '体', '旅', '之', '鞋', + '辣', '作', '粉', '包', '楼', '校', '鱼', '平', '彩', '上', + '吧', '保', '永', '万', '物', '教', '吃', '设', '医', '正', + '造', '丰', '健', '点', '汤', '网', '庆', '技', '斯', '洗', + '料', '配', '汇', '木', '缘', '加', '麻', '联', '卫', '川', + '泰', '色', '世', '方', '寓', '风', '幼', '羊', '烫', '来', + '高', '厂', '兰', '阿', '贝', '皮', '全', '女', '拉', '成', + '云', '维', '贸', '道', '术', '运', '都', '口', '博', '河', + '瑞', '宏', '京', '际', '路', '祥', '青', '镇', '厨', '培', + '力', '惠', '连', '马', '鸿', '钢', '训', '影', '甲', '助', + '窗', '布', '富', '牌', '头', '四', '多', '妆', '吉', '苑', + '沙', '恒', '隆', '春', '干', '饼', '氏', '里', '二', '管', + '诚', '制', '售', '嘉', '长', '轩', '杂', '副', '清', '计', + '黄', '讯', '太', '鸭', '号', '街', '交', '与', '叉', '附', + '近', '层', '旁', '对', '巷', '栋', '环', '省', '桥', '湖', + '段', '乡', '厦', '府', '铺', '内', '侧', '元', '购', '前', + '幢', '滨', '处', '向', '座', '下', '県', '凤', '港', '开', + '关', '景', '泉', '塘', '放', '昌', '线', '湾', '政', '步', + '宁', '解', '白', '田', '町', '溪', '十', '八', '古', '双', + '胜', '本', '单', '同', '九', '迎', '第', '台', '玉', '锦', + '底', '后', '七', '斜', '期', '武', '岭', '松', '角', '纪', + '朝', '峰', '六', '振', '珠', '局', '岗', '洲', '横', '边', + '济', '井', '办', '汉', '代', '临', '弄', '团', '外', '塔', + '杨', '铁', '浦', '字', '年', '岛', '陵', '原', '梅', '进', + '荣', '友', '虹', '央', '桂', '沿', '事', '津', '凯', '莲', + '丁', '秀', '柳', '集', '紫', '旗', '张', '谷', '的', '是', + '不', '了', '很', '还', '个', '也', '这', '我', '就', '在', + '以', '可', '到', '错', '没', '去', '过', '感', '次', '要', + '比', '觉', '看', '得', '说', '常', '真', '们', '但', '最', + '喜', '哈', '么', '别', '位', '能', '较', '境', '非', '为', + '欢', '然', '他', '挺', '着', '价', '那', '意', '种', '想', + '出', '员', '两', '推', '做', '排', '实', '分', '间', '甜', + '度', '起', '满', '给', '热', '完', '格', '荐', '喝', '等', + '其', '再', '几', '只', '现', '朋', '候', '样', '直', '而', + '买', '于', '般', '豆', '量', '选', '奶', '打', '每', '评', + '少', '算', '又', '因', '情', '找', '些', '份', '置', '适', + '什', '蛋', '师', '气', '你', '姐', '棒', '试', '总', '定', + '啊', '足', '级', '整', '带', '虾', '如', '态', '且', '尝', + '主', '话', '强', '当', '更', '板', '知', '己', '无', '酸', + '让', '入', '啦', '式', '笑', '赞', '片', '酱', '差', '像', + '提', '队', '走', '嫩', '才', '刚', '午', '接', '重', '串', + '回', '晚', '微', '周', '值', '费', '性', '桌', '拍', '跟', + '块', '调', '糕' + ] + # 然后我们创建一个font_name的字典,用来装字体编码和 --> 所对应的数字、汉字 + font_name_hour = {} + for index,value in enumerate(text_h): + # 这就是大众点评乱码的结构:由前面的三个字符‘&#x’+后面是小写字母和数字+分号‘;’ + h = font_names_h[index].replace('uni', '&#x').lower() + ';' + # 下面生成的这个就是乱码,他就对应刚刚字体文件的对应数字,可以运行看看 + font_name_hour[h] = value + + return font_name_hour + +def get_fontdish(): + font_d = TTFont('./woff/9ff532af.woff') + font_names_d = font_d.getGlyphOrder() + text_d = ['', '', '1', '2', '3', '4', '5', '6', '7', '8', + '9', '0', '店', '中', '美', '家', '馆', '小', '车', '大', + '市', '公', '酒', '行', '国', '品', '发', '电', '金', '心', + '业', '商', '司', '超', '生', '装', '园', '场', '食', '有', + '新', '限', '天', '面', '工', '服', '海', '华', '水', '房', + '饰', '城', '乐', '汽', '香', '部', '利', '子', '老', '艺', + '花', '专', '东', '肉', '菜', '学', '福', '饭', '人', '百', + '餐', '茶', '务', '通', '味', '所', '山', '区', '门', '药', + '银', '农', '龙', '停', '尚', '安', '广', '鑫', '一', '容', + '动', '南', '具', '源', '兴', '鲜', '记', '时', '机', '烤', + '文', '康', '信', '果', '阳', '理', '锅', '宝', '达', '地', + '儿', '衣', '特', '产', '西', '批', '坊', '州', '牛', '佳', + '化', '五', '米', '修', '爱', '北', '养', '卖', '建', '材', + '三', '会', '鸡', '室', '红', '站', '德', '王', '光', '名', + '丽', '油', '院', '堂', '烧', '江', '社', '合', '星', '货', + '型', '村', '自', '科', '快', '便', '日', '民', '营', '和', + '活', '童', '明', '器', '烟', '育', '宾', '精', '屋', '经', + '居', '庄', '石', '顺', '林', '尔', '县', '手', '厅', '销', + '用', '好', '客', '火', '雅', '盛', '体', '旅', '之', '鞋', + '辣', '作', '粉', '包', '楼', '校', '鱼', '平', '彩', '上', + '吧', '保', '永', '万', '物', '教', '吃', '设', '医', '正', + '造', '丰', '健', '点', '汤', '网', '庆', '技', '斯', '洗', + '料', '配', '汇', '木', '缘', '加', '麻', '联', '卫', '川', + '泰', '色', '世', '方', '寓', '风', '幼', '羊', '烫', '来', + '高', '厂', '兰', '阿', '贝', '皮', '全', '女', '拉', '成', + '云', '维', '贸', '道', '术', '运', '都', '口', '博', '河', + '瑞', '宏', '京', '际', '路', '祥', '青', '镇', '厨', '培', + '力', '惠', '连', '马', '鸿', '钢', '训', '影', '甲', '助', + '窗', '布', '富', '牌', '头', '四', '多', '妆', '吉', '苑', + '沙', '恒', '隆', '春', '干', '饼', '氏', '里', '二', '管', + '诚', '制', '售', '嘉', '长', '轩', '杂', '副', '清', '计', + '黄', '讯', '太', '鸭', '号', '街', '交', '与', '叉', '附', + '近', '层', '旁', '对', '巷', '栋', '环', '省', '桥', '湖', + '段', '乡', '厦', '府', '铺', '内', '侧', '元', '购', '前', + '幢', '滨', '处', '向', '座', '下', '県', '凤', '港', '开', + '关', '景', '泉', '塘', '放', '昌', '线', '湾', '政', '步', + '宁', '解', '白', '田', '町', '溪', '十', '八', '古', '双', + '胜', '本', '单', '同', '九', '迎', '第', '台', '玉', '锦', + '底', '后', '七', '斜', '期', '武', '岭', '松', '角', '纪', + '朝', '峰', '六', '振', '珠', '局', '岗', '洲', '横', '边', + '济', '井', '办', '汉', '代', '临', '弄', '团', '外', '塔', + '杨', '铁', '浦', '字', '年', '岛', '陵', '原', '梅', '进', + '荣', '友', '虹', '央', '桂', '沿', '事', '津', '凯', '莲', + '丁', '秀', '柳', '集', '紫', '旗', '张', '谷', '的', '是', + '不', '了', '很', '还', '个', '也', '这', '我', '就', '在', + '以', '可', '到', '错', '没', '去', '过', '感', '次', '要', + '比', '觉', '看', '得', '说', '常', '真', '们', '但', '最', + '喜', '哈', '么', '别', '位', '能', '较', '境', '非', '为', + '欢', '然', '他', '挺', '着', '价', '那', '意', '种', '想', + '出', '员', '两', '推', '做', '排', '实', '分', '间', '甜', + '度', '起', '满', '给', '热', '完', '格', '荐', '喝', '等', + '其', '再', '几', '只', '现', '朋', '候', '样', '直', '而', + '买', '于', '般', '豆', '量', '选', '奶', '打', '每', '评', + '少', '算', '又', '因', '情', '找', '些', '份', '置', '适', + '什', '蛋', '师', '气', '你', '姐', '棒', '试', '总', '定', + '啊', '足', '级', '整', '带', '虾', '如', '态', '且', '尝', + '主', '话', '强', '当', '更', '板', '知', '己', '无', '酸', + '让', '入', '啦', '式', '笑', '赞', '片', '酱', '差', '像', + '提', '队', '走', '嫩', '才', '刚', '午', '接', '重', '串', + '回', '晚', '微', '周', '值', '费', '性', '桌', '拍', '跟', + '块', '调', '糕' + ] + # 然后我们创建一个font_name的字典,用来装字体编码和 --> 所对应的数字、汉字 + font_name_dish = {} + for index,value in enumerate(text_d): + # 这就是大众点评乱码的结构:由前面的三个字符‘&#x’+后面是小写字母和数字+分号‘;’ + h = font_names_d[index].replace('uni', '&#x').lower() + ';' + # 下面生成的这个就是乱码,他就对应刚刚字体文件的对应数字,可以运行看看 + font_name_dish[h] = value + + return font_name_dish + +if __name__ == '__main__': + font_name_tel = get_fonttel() + font_name_time = get_fonttime() + font_name_hour = get_fonthour() + font_name_dish = get_fontdish() + get_Shopdetails(font_name_tel,font_name_time,font_name_dish) \ No newline at end of file