而據(jù)相關(guān)媒體報道,,旅游網(wǎng)站攜程與“去哪兒”同樣發(fā)生過“點評數(shù)據(jù)之爭”。2008年,,因“去哪兒”網(wǎng)站中有數(shù)萬個頁面轉(zhuǎn)載有攜程酒店點評文章,,攜程將“去哪兒”告上法庭,。最終經(jīng)法院審理確認,,攜程擁有該網(wǎng)站內(nèi)容及資源的版權(quán),,“去哪兒”行為屬于侵權(quán),。
記者調(diào)查:多個旅游網(wǎng)站均存在“點評搬運”現(xiàn)象
按照乎睿數(shù)據(jù)的說法,,馬蜂窩若抄襲了1800萬條點評,如此量級的數(shù)據(jù)遠非人力所能完成,,有業(yè)內(nèi)人士表示,,該行為或是利用爬蟲軟件完成。
所謂爬蟲軟件,,是指按照一定規(guī)則,,自動抓取互聯(lián)網(wǎng)信息的程序或者腳本。該人士表示,,利用爬蟲軟件,,抓取其他網(wǎng)站數(shù)據(jù),再搬運到自身平臺,,這在互聯(lián)網(wǎng)行業(yè)并非新鮮事,。
事實果真如此?爬蟲軟件抓取數(shù)據(jù)難度有多大,?記者隨機選取了北京一家酒店,,利用爬蟲軟件,不到兩分鐘便抓取了其在攜程和同程旅游網(wǎng)站中的百余條點評內(nèi)容,。通過比對兩份數(shù)據(jù),,記者發(fā)現(xiàn),該酒店在兩個網(wǎng)站中存在13條完全雷同的點評,,而且多數(shù)點評在兩個網(wǎng)站所顯示的日期完全相同,。
其他平臺是否也存在此類現(xiàn)象?記者進一步檢索該酒店在其他平臺的點評數(shù)據(jù),,發(fā)現(xiàn)驢媽媽,、馬蜂窩等旅游網(wǎng)站中,點評雷同的現(xiàn)象同樣存在,。其中一條103字的點評內(nèi)容在同一天內(nèi)分別出現(xiàn)在了攜程,、同程旅游和驢媽媽網(wǎng)站上——這意味著有消費者在一天內(nèi)通過三個平臺訂了同一家酒店,并發(fā)表完全相同的點評,,顯然并不合理,。記者發(fā)現(xiàn),該酒店在驢媽媽上一共有5條點評,,均能在其他平臺的點評中找到完全相同的“孿生兄弟”,。
“點評搬運”是網(wǎng)站行為還是個別酒店的行為,?對此,記者又隨機抓取了上海兩家排名較靠前的酒店在不同平臺的點評數(shù)據(jù),,發(fā)現(xiàn)或多或少均存在雷同的點評,,這些點評中,既有相對簡單的好評,,也有長篇控訴和差評,,部分點評賬戶連名稱都是“搬運”而來。值得一提的是,,記者在比對數(shù)據(jù)中將“一字不差”作為判定雷同的標準,,許多在搬運后由人工進行“洗稿”的點評并未反映在內(nèi)。
央視網(wǎng)消息(記者王博雅韓雪邢明):東興位于我國大陸海岸線最西南端,海陸邊境線長89公里,,是我國唯一與東盟國家海陸相連的口岸城市,。