字体:大 中 小
护眼
关灯
上一页
目录
下一页
重回1988之IT女王 第78节 (第4/5页)
都已经赢麻了。 等将来电信直接开放端口,把赚差价的中间商一脚踢开,那真是为谁辛苦为谁忙,毫无意义。 “不如我们做搜索引擎吧,我连钱教授注册的域名都记不住,现在才几个网站,等将来网站多了,更记不住了。” 技术总监觉得安夏说的有道理,在他心中,搜索引擎就是个查号台,用的人可能不多,不过还是得有。 如果他知道后世有人在百度上搜索谷歌,不知道会不会大跌眼镜。 当技术一开始研发,他就发现了问题。 搜索引擎的技术含量比早期的ftp文件搜索器要高许多。 首先要打通的难关是用什么方法才能找到拥有对应字符的网页。 现在国外域名已经有很多,散落在互联网的世界中,总不能要他们像登记黄页一样,一个一个的上报吧…… 技术总监用力抓了抓日渐稀少的头发。 听到汇报之后,安夏心想:难道现在还没有爬虫技术? 嗯……应该有办法解决的。 怎么解决来着……我是一产品经理,没干过这事啊…… 安夏在自己仅存的技术记忆中搜寻相关知识。 唉,让他们先试试吧,实在不行,就去麻省理工,把爬虫发明者抓来。 “你们先试试选一些网页,把链接地址作为种子url,把它们放进待抓取的队列中,做个程序,读取这些url,然后再通过dns。哦,就是域名系统解析,可以转换成网络服务器对应的ip地址。 然后下载对应页面,就可以抓取网页上的相关数据了
上一页
目录
下一页