網絡世界沒有空間概念,但有幾種方式可以將網民標注到物理世界的地理坐標上,比如GPS,比如IP地址。因為移動互聯網的普及,GPS大概已經廣泛地被人所知(連不會說英文的小販都能準確說出“機匹誒死”四個音節),而IP地址卻并不常被提起。
早期QQ聊天界面里輸入框的側欄用戶信息欄里會標注對方位于“廣東順德”或者某個地址位置,這些地址信息就是根據IP地址給出的參考結果。每一個IP地址對應一個(或多個)物理地址,眾多的IP地址及對應的地理信息就構成了IP地址庫。
“高春輝的個人主頁”的作者、手機之家創始人——那個網友說“看見您的名字,我就想起了96、97年剛上網那會兒”,現在就在做賣IP庫服務的生意,網站叫IPIP.NET。
IP地址是有對應的物理地址的,但相互之間沒有必然聯系,運營商可以把一個IP 段比如103.196.XXX/XX分配到世界上任意一個角落,哪怕是分配好了也可以再變更,一個今天在贛州的IP地址,也許明天就可能變成南昌的了;有可能你去離家不到1公里的網吧登錄QQ,系統會提示你“異地登錄請注意賬號安全”。IP信息是動態的,世界上沒有一個100% 準確的IP庫,只有相對準確的IP庫——他希望做到 NO.1 的位置。
維護一個相對準確的IP地址信息庫是相當卷帙浩繁的工程。他從做ipip.net到現在超過兩年的時間,只有一天兩天沒有更新數據。“也不是真的一定需要每天更新,只不過要提著這股勁兒,怕松懈,一旦停下來有可能就會斷掉了。我見過很多人做事情一開始是熱火朝天雄心勃勃的,后來中途發生一點變故,就中斷了。你看起點上那么多網絡小說信誓旦旦地說‘絕不斷更’、‘絕不太監’,后面還是因為各種各樣的原因就沒有然后了,連停更公告都沒有。”
為什么會選擇IP庫這么考驗耐力和毅力的工程?
這要從他2007年在ECSHOP的時候說起,那時候為了做用戶訪問分析,他開始接觸IP庫,當時市面上最主流的是純真IP庫,但純真的數據結構相對雜亂,“北京”、“北京朝陽”、“呼家樓”,大到省級,小到樓棟,沒有辦法直接使用;并且因為無法驗證,準確性也沒有保障,一個被標注為北京的IP地址,實際上有可能是山東的。“當然就是想驗證的話可能也驗證不了,你憑什么驗證呢?人家沒條件又沒收入,能堅持做就不錯了。”他說。
純真也是一個很特別的團隊,十年如一日地維護著一個免費的IP庫,保持五天一更新的節奏。“你試試?”
但那個時候,高春輝并沒有打算要自己做一個IP庫,因為覺得工程浩大,自己無法堅持下去:“光是想想一個40歲的大叔天天在電腦面前給你維護IP庫,自己就先哭了。”
2011年,他開始做“愛壁紙”,這種圖片應用用戶對流量和下載速度都非常敏感,所以高春輝花了不少精力去研究如何改善體驗,其中一件很重要的事情就是通過解析CDN 加速域名獲知用戶的物理地址。原先的愛壁紙業務趨于穩定,他在這件事上投入的時間越來越多,越發覺得目前市面上的IP庫用得不順手。“干脆自己做一個。”
認識他的人都知道他的風格是不走別人的老路,“一個不能和別人拉開檔次的事情,絕對不干”。
首先是原始數據的積累,包括不限于利用市面上已有的數據庫,解析、結構化、重新入庫,自有或者其它可信任的數據來源,全球 WHOIS / BGP / ASN / RADB 數據,自行維護的全球 rDNS 以及骨干網路由 IP 數據庫,運營商、客戶、合作伙伴的反饋數據和網友提交糾錯的數據等等。這些數據每天都在更新,新增,或者發生一些變化。
解決了原始數據積累,接下來就是數據準確程度的問題,高春輝用了280多個遍布于世界的云主機作為監測點,比如要驗證一個IP是不是位于紐約,就從紐約就近的幾個監測點去訪問這個地址,從響應的速度——是不是一毫秒兩毫秒——去判斷這個地址是不是真的在紐約。
這280個監測點的分布,除了中國大陸、港臺、亞太地區(澳門暫時沒有)占據了不少之外 ,北美和歐洲分布也比較密集。“拉美和非洲加起來都不過10來個,印度也很少,監測點的分布和需求是對應的。現在很多國內廠商出海第一站是印度,那可能是物理世界的市場足夠大,但對于我們這樣的純數字業務,感受不明顯,反而不如巴西。”
每天對著一堆數字和表格,維護數據庫是一個相當消磨耐心和毅力的工作。高春輝說,它首先是一個技術活,其次還是一個力氣活,如果你問競爭對手做了怎么辦,騰訊做了怎么辦,你倒是讓他們先去試試。
網絡情況
“我去見一個曾經維護過 IP 庫的朋友的時候,聊著聊著就差抱頭痛哭了,因為遇到的坑大部分是一樣的。”他說。
IP庫的需求和價值在哪兒?
對于處于草莽階段的公司來說,驗證產品需求是否強烈、商業模式是否可行是第一要務,用戶地址定位的準確與否并不急迫,開發者往往從淘寶、新浪、百度的IP庫里爬一些數據或者從純真上面下載一個了事,這在粗放經營的業務形態里一般也沒有什么大問題。
但對于產品形態已經確定、需要精細化運作的公司來說,IP地址的準確度和產品體驗就發生了關系。一般來說,有如下幾種場景需要IP地址庫:
基于地理位置的服務,比如58同城,美團,大眾點評,地方商超的互聯網產品,需要根據用戶的準確位置來推送相關信息,他的客戶說,移動產品反而更需要精確的地域數據,畢竟GPS從用戶角度,不是每個應用的強需求。
對訪問要求比較高,比如游戲、在線視頻、音頻,靜態內容等等,可以根據IP地址引導用戶去就近就快訪問服務器,用戶體驗會更有保障。
對于廣告行業,有精準投放廣告的需求,比如按照用戶所在地域。
最普遍的需求就是做用戶的地域數據分析,尤其是規模達到一定程度以上的情況,比如用戶百萬日活以上。
除此之外,任何互聯網產品,如果能夠有精確的地理信息,體驗都會得到改善。十家公司做一樣的產品,最終勝出來的只有一家,他們是產品形態、功能、創意上有什么本質的差別嗎,或者可能只是因為那一家的響應速度比其他幾家快了那么幾十毫秒、推送的店鋪離用戶近了50米種種潤物細無聲的差異而已?
而據他說,他們維護的版本和別的IP庫版本相比,差異度是隨著時間逐漸加大的。
ipip.net現在的付費用戶約200個,遍布安全、硬件、電商、移動廣告、生活服務門戶、CDN、云存儲等領域。至于到底有多少公司需要用準確的IP庫,高春輝并沒有一個確切的答案,誰也不知道天花板在哪里。
“用戶付費之后,你把離線數據庫整包都發給他,這樣數據不是很容易流出去?”
“我經常跟別人說,用戶買的不是我們的數據,而是更新和維護服務,用戶買回去基本上是‘開箱即用’,不需要自己折騰,我們有專人和專業積累來幫他們維護更新;加上定價也并不難以接受(高配版的年費9600,平均一個月800塊,這個錢你連實習生都雇不到),一般企業用戶不愿意也不應該花這個時間和金錢成本,他們的時間應該花在自己的‘刀刃’上,做好自己的應用,而不是在基礎設施上較勁。如果他非要用這種方式去用,我也沒辦法干預,這樣的用戶,哪怕是沒有備用選項,本來也沒有多大可能會付費的。”他講。
ipip.net仍然維持著不間斷的數據完善和修正。“要不是跟你在這兒聊天,我可能這會兒就正在電腦前更新數據庫。”目前,得益于那兩百個付費用戶帶來的收入,ipip.net已經由依賴他個人熱情的one man project變成了3、4個人的團隊。
有用戶付費使用更好的服務,一個團隊因此有了良好的商業回報而持續輸出穩定、可靠的服務,一部分沒有支付能力的人可以無償使用免費版——他正努力創造一個多贏局面。
他們也在研發新產品,也許就快就會推出來。

