當前位置:浩楓渡 > 網絡營銷 > 基于Google-S2的地理相冊服務實現及應用【最新頭條】 基于Google-S2的地理相冊服務實現及應用【最新頭條】 作者:浩楓渡電商網來源:浩楓渡時間:2020-07-10 19:29 導讀:核心提示:在這樣的變化下,馬蜂窩充分發揮內容與社區優勢,讓大家在疫情期間每天在平臺上通過瀏覽其他網友發布的視頻和筆記找到正能量宅在家的同時可以進行“云旅行......基于Google-S2的地理相冊服務實現及應用【最新頭條】核心提示:在這樣的變化下,馬蜂窩充分發揮內容與社區優勢,讓大家在疫情期間每天在平臺上通過瀏覽其他網友發布的視頻和筆記找到正能量宅在家的同時可以進行“云旅行”,收藏和點贊自己想去的地方。用戶發布筆記的第一個環節就…寫在前面對抗疫情的戰斗還在繼續。做好個人和家庭的防護,保持良好的心態,過好自己的生活,就是每個普通人抗擊疫情最好的武器。在這樣的變化下,馬蜂窩充分發揮內容與社區優勢,讓大家在疫情期間每天在平臺上通過瀏覽其他網友發布的視頻和筆記找到正能量宅在家的同時可以進行“云旅行”,收藏和點贊自己想去的地方。為了不斷優化用戶在馬蜂窩分享內容的體驗,我們一直在努力。本文主要介紹馬蜂窩內容業務研發團隊在地理相冊空間索引方面的探索和應用實踐,希望為有類似問題的同學帶來一些思路。疫情終將過去,那些被取消的旅行計劃,會在風景更美的時候成行。隨著智能手機存儲容量的增大,以及相冊備份技術的普及,我們可以隨時隨地用手機影像記錄生活,在手機中存儲幾千張甚至上萬張照片已經是很常見的事情。但另一方面,當我們想從這么多張照片中去找到一張,也是一件麻煩事。馬蜂窩作為旅行玩樂平臺,希望實現「會玩的人」與「好玩的事」之間的連接。眾多旅行愛好者在這里記錄和分享他們的旅行記憶,使馬蜂窩在旅游領域累積了大量內容。因此,不斷優化用戶在發布內容時的體驗是我們一直努力的主向。用照片、視頻記錄旅行是最直接的方式。本文將介紹馬蜂窩如何通過地理相冊空間索引的應用,為用戶提供直觀、好用的圖片分享服務。.應用場景和需求要想讓用戶快速地找到想要分享的照片視頻,我們需要一個有效且合理的篩選手段,對用戶的相冊進行聚合、排序,提升用戶依托相冊去分享和記錄生活時易用性和便捷性。首先要確定聚合排序的篩選維度。照片的地理位置就是最直觀的分類維度同時,記錄最近發生的事情符合用戶的發布行為習慣。因此我們方案要滿足的需求是:根據目的地和時間,對用戶相冊進行聚合、排序基于某個地理位置信息和給定范圍,在用戶相冊中搜索給定范圍的照片視頻。本文提及的地理相冊服務在馬蜂窩內主要有兩個落地場景。.筆記「筆記」是以圖片、視頻為主要呈現形式的旅行短內容分享。用戶發布筆記的第一個環節就是從相冊中選擇需要發布的照片視頻,在新版中,基于地理相冊服務結合馬蜂窩自有目的地數據,對用戶相冊進行按照地點維度的聚合分類,并且按照片視頻的創建時間由近及遠的排序,提升用戶選擇發布效率。.足跡「足跡」這一產品的功能,旨在幫助馬蜂窩用戶以自動同步或手動點選去過的國家和地區這種更簡易的方式記錄旅行。在「我的足跡」中有一個場景,會鼓勵用戶對去過的但還沒有發布筆記的地點發布筆記。此時地理相冊服務可以幫助用戶發布相冊中以指定地點為圓心,給定半徑范圍內的所有照片。.方案設計與算法選型.初期方案初期我們想到的方案比較直觀,也比較粗暴,就是對相冊進行遍歷后由服務端計算結果。具體來說,首先取出用戶所有攜帶地理信息的照片視頻,然后將地理信息經緯度上傳服務端,由服務端進行聚合和篩選,返回給客戶端結果,但是這個方案有很多缺點。文章開始我們已經描述了目前用戶手機設備中的照片數量是成千上萬的,如果遍歷所有圖片,這上傳的數據體量是巨大的同時,一般用戶照片的地理位置會有很多呈現出成簇聚集的狀態,因為一般我們會在一個地點范圍內拍攝許多照片,這就導致了大量的重復聚類的計算。如果要優化這個方案,針對第一個需求我們可以采用緩存+增量請求的方式,因為用戶分類數據是穩定的。但是針對給定范圍查詢的需求,我們無法做緩存,這就需要每次都請求服務端做大量的計算,對于時間的消耗是不能容忍的。可以看到,上述方案的挑戰主要在于用戶相冊中地理信息的數據量和重復度、依賴服務端計算搜索結果導致的性能問題和用戶體驗。經過調研我們發現,基于地理空間點經緯度索引算法可以很好地解決這些問題。.基于地理空間點索引算法的實踐結合我們的實際需求來理解地理空間點索引算法,即找到合適的方法來對地理空間中海量的坐標點添加索引,從而對空間點進行快速查詢和排序的一種算法。我們對一些比較通用的地理空間點索引算法進行了選型比較,下面主要介紹算法和算法。..算法選型算法即地理位置距離排序算法。是一種地理編碼,由發明。它利用一種分級的數據結構,把空間劃分為網格。屬于空間填充曲線中的階曲線的實際應用。有一個和階曲線相關的性質,那就是一個點附近的地方字符串總是有公共前綴,并且公共前綴的長度越長,這兩個點距離越近。由于這個特性,就常常被用來作為唯一標識符,比如在數據庫里面可用來唯一表示一個點。這個公共前綴的特性就可以用來快速的進行鄰近點的搜索。越接近的點通常和目標點的字符串公共前綴越長。但是階曲線有一個比較嚴重的問題,就是它的突變性。在每個字母的拐角,都有可能出現順序的突變,導致搜索臨近點的精確度較差,不能滿足我們的業務場景對精確度的要求。算法其實是來自幾何數學中的一個數學符號2,它表示的是單位球。算法采用正方體投影的方式將地球展開,然后利用希爾伯特分形曲線將展開后的二維地球進行填充,完成了對三位地球的降維和分形,從而得到空間坐標點與希爾伯特分形曲線的函數關系,即將球面經緯度坐標轉換成球面坐標,再轉換成正方體投影面上的坐標,最后變換成修正后的坐標在坐標系變換,映射到^^區間,最后一步就是把坐標系上的點都映射到希爾伯特曲線上。最終,映射到希爾伯特曲線上的點成為,即是空間坐標點的索引。的最大的優勢在于精度高。有級,從到.,中間每一級的變化比較大。有時候可能選擇上一級會大很多,選擇下一級又會小一些。而有級,從.2到2,中間每一級的變化都比較平緩,接近于次方的曲線。所以選擇精度時不會出現選擇困難的問題。綜上,算法能夠滿足我們對于功能和精度上的要求,因此最終選擇算法作為空間點索引算法的實現方案。.功能實現與性能優化.模塊設計本文中的地理相冊服務主要基于相冊索引數據操作、用戶相冊掃描、相冊索引服務和相冊地點分類計算四大模塊實現:以下分別介紹。..相冊索引數據操作模塊相冊位置信息的索引采用數據庫作為存儲介質,將用戶照片信息以及通過算法計算出來的存儲到數據庫當中。其中,考量存儲的數量和對搜索和聚合經度的要求,存儲了從~經度級別的。相冊索引數據操作模塊,由數據庫和數據庫操作層組成。數據表的設計見下圖數據庫操作層封裝了數據插入、刪除、查詢等基本操作的。..用戶相冊掃描模塊用戶相冊掃描模塊基于原生提供的相冊查詢的,將用戶相冊的數據與本地數據庫中存儲的照片數據進行對比,提取出新增照片數據和用戶已經刪除的照片。..相冊索引服務模塊相冊索引服務模塊,是基于算法的相冊服務的核心模塊。模塊功能如下直接與數據模塊交互,向使用者屏蔽數據層的數據操作細節,提供滿足查詢、搜索等需求的查詢指定下的照片資源查詢指定下,相冊照片索引后的查詢以指定坐標點為圓心、指定半徑范圍內的照片與用戶相冊掃描模塊交互,獲取新增照片和已經刪除照片的數據,更新數據庫內容,同時支持查詢和通知更新狀態..相冊地點分類計算模塊相冊地點分類計算模塊是計算用戶相冊的地點分類結果的核心模塊。該模塊的主體功能如下獲取相冊索引服務中的照片,作為參數上傳至服務端,服務端根據地圖服務提供的聚合接口,將的聚合結果返回給服務端綜合考量精確度和的數據量,選取的作為請求服務端的等級調用相冊索引服務模塊根據指定獲取的方法得到去重后的服務端返回的數據結構是_目的地與的一對多的映射關系利用本地相冊索引服務中的照片,根據上一步服務端返回的分類數據進行分類緩存每次地點分類的計算結果.整體流程相冊索引服務模塊會在啟動時更新服務,將本地數據與相冊數據同步。當用戶觸發地點相冊功能時,相冊地點分類計算模塊會先取出緩存在本地相冊地點分類計算結果展現給用戶,同時驅動相冊索引服務更新。在收到更新服務更新完畢的通知后,首先向相冊請求的全量去重的,然后將上傳服務端由服務端計算分類,最后結合相冊索引服務的全量照片數據,計算照片的地點分類結果,緩存結果并渲染展現給用戶。.性能優化..獲取相冊增量照片相冊索引服務模塊需要同步服務和用戶相冊的照片資源數據,找到新增數據,加入到服務數據庫中。最初設計的獲取新增數據方案如下:.獲取全量的用戶相冊的數據.遍歷用戶照片,查詢是否存在本地服務數據庫中但是這個方案應用到照片量較大的手機上時,獲取新增照片的時延很高。排查后我們發現原因在于全量遍歷用戶相冊時延很高,同時在遍歷中頻繁查詢數據庫也比較耗時。經過調研發現,的用戶相冊有「最近項目」的相冊分類,該相冊分類下的資源只按照添加順序的倒序排列,即越新的照片越靠前。故將方案優化如下:.:從列表頭部截取條.:將該條追加為新增照片.:判斷該條中的最后一條,即新增時間最晚的一條,查詢是否存在于服務數據庫中若不存在,繼續.若存在,停止截取,從而得到新增照片..漸進計算相冊照片的地點分類相冊地點分類計算模塊在獲得服務端返回的分類結果_與列表的映射關系后,根據結果對本地服務數據庫中的照片進行分類。最初的方案如下.:遍歷結果列表,獲得每個_映射的列表.遍歷列表,通過向相冊索引服務模塊查詢屬于該索引下的照片資源,從而獲得該_對應的照片資源.對該目的地下的照片按照創建時間倒序排序.:將所有目的地維度照片分類結果,按照每個結果集中照片最晚創建時間,即第一個照片的創建時間,進行倒序排序,獲得按照地點維度和創建時間維度排序的地點相冊的最終計算結果。這樣的方案導致在地點相冊首次計算的時候,用戶需要等待所有目的地下的結果計算完畢后才能展現給用戶,同時需要多次按照創建時間排序,導致時延很高,冷啟動下用戶體驗很差。為此,我們做出了方案優化,減少排序次數,同時通過漸進加載的方式優化用戶體驗。主要思路是相冊索引服務模塊的數據庫中,存儲照片的創建時間可以通過查詢,按照創建時間倒序排列的所有照片資源,獲取倒序排列的照片資源集合:.:每次從照片資源集合頭部取條照片遍歷每一張照片,根據照片的,從_映射表中查詢所屬的目的地判斷照片目的地分類結果集中是否存在該目的地的照片資源分類集合存在,追加該照片創建該目的地的結果集,追加到照片目的地分類結果集中,并追加該照片.:將該張照片的分類結果渲染展現給用戶.:計算完所有照片的分類,通知結束渲染,計算完畢。以上方案,將全量的本地照片資源以張為一批次,進行漸進計算,同時漸進渲染,縮短了用戶的等待時間同時,依托關系型數據庫的排序能力,減少排序次數,優化了性能。.未來規劃和總結目前,本文介紹的基于算法實現的地點相冊在馬蜂窩客戶端已經上線一段時間,并且為筆記發布量帶來了正向增長。但是這套方案在數據庫數據處理中已經對于算法的使用上仍然有很大的優化和探索空間,后續我們團隊也會對其不斷優化和深挖。算法服務在馬蜂窩客戶端中的實現和落地,成果不僅僅是滿足了筆記發布場景的探索,更使得客戶端具備了對于用戶相冊照片百米級精確度的索引和搜索的能力,可以為后續更多、更復雜的業務場景服務,相信在不遠的未來能為用戶提供更便捷、更有趣的旅行記錄產品。 聲明:該文觀點僅代表作者本人,本站為資訊信息發布平臺,僅提供信息展示服務,如果侵犯了您的權益,請與本站聯系,我們將立即刪除。 原標題:基于Google-S2的地理相冊服務實現及應用【最新頭條】 說點什么吧 全部評論(0) 最新 最早 還沒有評論,快來搶沙發吧! 上一篇:法國反水了,突然對華為設置重重阻礙,和禁止華為沒區別了【最新頭條】 下一篇:疫情拐點未到購物中心拐點已至【最新頭條】 相關文章 這些小眾的黑科技app,意外的好用 「電子信箱」消費環境起變化 「酷狗新聞」網絡消費者的購買行為 2017端午節活動策劃方案_端午節活動方案 2018上半年B2B電商交易額同比增14.2% 營收規模增 「酒店租房」電子商務網站的開發流程 電商運營 第四個“全國科技工作者日”,總書記回信勉勵 直通車推廣的六個技巧助你淘寶店鋪騰飛 我在抖音里孤獨消費,卻在視頻號里熱烈生產 讓數字化服務無處不在 看無人售飯機,是如何顛覆 如何知道寶貝在淘寶的排名 如何提高排名? 從燈塔工廠到燈塔工業 工業富聯擴大工業互聯 軟銀即將敲定牽頭向滴滴出行自動駕駛部門投資 電商服務 電商從未死去 阿里巴巴運營怎么做?先從最基本的開始 XSKY發布XMotion納管熱遷移技術,OpenStack集群遷移 楊冪“出手”,葉璇退出,明星組團殺入直播帶 CISE2020 中國(南京)國際智慧節能博覽會將在9月召 阿里巴巴聯合BCG發布數字化品牌資產DeEP模型 打響“電商革命” 同城零售時勢已至 為什么各大企業都開始做短信營銷了 標簽云 電商運營提成方案 智能工廠 互聯網電商 電商運營經理崗位職責 健康安全 花生電商 家居企業 生活環境 生產線 天貓 電商新產品 電商市場調查 無圖模式 新媒體與電商 太原電商街 文檔預覽 淘寶 截屏分享 文化生活 阿里巴巴