A. 數據挖掘要解決什麼問題
首先是數據的可伸縮性,提高或改變數據的可伸縮度;其次是解決數據高維性的問題;處理異種數據和復雜數據;解決數據所有權與分布問題;對非傳統的分析進行合理處理。
B. Access資料庫在區域網中共享許可權的問題
資料庫對象的許可權和所有權存儲在資料庫中。由於許可權和所有權始終與存儲在工作組信息文件中的用戶和組帳戶相關聯,因此已設置安全機制的應用程序必須始終能夠指向對其進行保護的特定的工作組信息文件。
當您從同一個工作站或伺服器使用多個 Access 資料庫時,可以使用多個工作組信息文件。其中一個資料庫可能設置有安全機制,而其他資料庫則沒有設置。每個資料庫都可以有它自己單獨的安全方案。在對 Access 應用程序設置安全機制之後,在設置安全機制時所使用的工作組信息文件是該資料庫將要使用的唯一的工作組信息文件。工作組信息文件可以復制到每個本地工作站或者在整個網路中共享。 用戶可以使用默認的工作組信息文件,也可以強制 Access 使用為特定資料庫創建的已設置安全機制的工作組信息文件。要將已設置安全機制的特定資料庫文件與它們的工作組信息文件相關聯,您必須創建桌面快捷方式。每個桌面快捷方式必須都設置了命令行選項,才能啟動特定的資料庫,並使用受該資料庫保護的特定工作組信息文件。
在區域網中最簡單的方法就是:
資料庫屬性---安全----許可權
可以根據不同的用戶設置不同的許可權(完全控制/修改/讀取)
C. 更改當前資料庫所有者
這個其實可以這樣
本地資料庫新建一個資料庫test
然後導入之前的備份文件MYDB.BAK;
本地資料庫test備份導出為test.bak;
然後就可以使用test.bak文件進行導入到其他的資料庫或者空間資料庫還原。
D. 數字經濟時代「數權」問題的幾點思考
"數權"就是數據權益,分為所有權、使用權、交易權等。隨著數字經濟時代的到來,各類數據被作為數據資產,越來越具有市場價值。出於各種利益誘惑,數據也被濫用或非法交易,嚴重侵犯了政府、企業或個人的合法權益。目前國內「數權」的現狀令人堪憂,保護「數權」任重道遠。
國務院印發《「十四五」數字經濟發展規劃》提出,嚴厲打擊數據黑市交易,營造安全有序的市場環境。國家發改委等部門也聯合發布相關文件,明確提出嚴厲打擊平台企業超范圍搜集手機個人信息等違法行為,從嚴防控非必要搜集數據行為,依法依規打擊黑市數據交易。
然而非法搜集、佔有、使用、買賣各類涉及政務、交易、個人信息等數據的行為屢禁不止。尤其是個人信息更為嚴重,可能大家都遇到過剛買完房,各種中介的電話就沒完沒了;孩子剛入學,各種培訓機構的電話接二連三的打進來;在網站搜索了一個關鍵詞,瀏覽網頁時就會看到各種購物網站的相關產品廣告。這些令人頭痛的騷擾電話和廣告的背後,是對數據要素的非法侵佔和數據黑市的非法交易。
工信部年初印發《「十四五」大數據產業發展規劃》,提出加快培育數據要素市場,建立數據要素價值體系,並明確發揮大數據特性優勢,強化大數據在政府治理、社會管理等方面的應用。在進行數據挖掘利用的同時,如何依法合規地使用數據要素,保護數據權益,也將是我們面臨的重大課題。
其實國家先後出台了一些法律法規,來規范數據的合法使用,保護數據安全和個人隱私。《網路安全法》主要規范了建設、運營、維護和使用網路的活動以及網路安全的監管;《數據安全法》主要規范除個人信息以外的其他數據的安全、治理和交易行為;《個人信息保護法》 主要是對個人信息和個人隱私的保護。
今年2月15日由國家互聯網信息辦公室等十三部門聯合修訂發布的《網路安全審查辦法》正式施行。既是適應國際國內網路安全新形勢的必然舉措,也是進一步落實2021年新實施的《數據安全法》和《關鍵信息基礎設施安全保護條例》的必然要求。
數據權益的保護需要依靠法律依據,需要依法規范數據的獲取、存儲、管理、使用、交易等過程,保護數據權益人的數據所有權、使用權、交易權。然而當前對於數據權益的法律邊界不是很清晰,需要企業和個人基於倫理准則去處理數據,數據倫理也是一個社會責任問題。尤其是涉及個人隱私數據時,倫理准則和法律規范都非常重要。
數據要素作為一種資產,業內也在一直爭論其權屬問題,到底數權應該歸誰,政府、企業、還是個人?
首先來看政務平台行政業務數據,隨著數字政府的推進,各級政府部門、行管部門都在開發應用數字政務平台,但由於政府自身很少有信息化系統建設能力,多數是通過科技公司建設開發的,毋庸置疑政務數據歸政府部門所有。一些系統建成後有些是由政府部門自己維護管理,還有些地方政府部門沒有相應的技術能力,必須依賴科技公司進行運行維護管理,因此這些科技公司擁有一些涉及政府運營或行政審批數據的許可權,這樣就造成了一定的風險。
再來看電子商務平台交易數據和社交平台的用戶數據,數字經濟時代,人們的衣、食、住、行、就醫、社交、工作都深度依賴互聯網,各類電商平台和手機應用不僅記錄著你的交易數據,甚至追蹤你的每次點擊操作,你的瀏覽行為和關注商品都會被採集下來,還有各種物聯設備,隨時追蹤著你的位置信息、實時監測數據,這些數據可能進入非正常營銷活動,有些被大數據用來「人肉搜索」、「殺熟」,甚至被用來被騙。這些平台採集的數據都屬於個人隱私,所有權不應當歸平台或開發公司所有,平台和公司只能在有限授權下使用,更不能用來非法交易和傳播。
首先,政府要加大立法和監管執法力度。應該依據《網路安全法》、《數據安全法》、《個人信息保護法》這幾部法律法規,加大監管執法力度。另外,政府部門需要不斷增強內部技術能力和數據治理能力,做好政務數據的數據安全和數權保護。
其次,企業要嚴守法律和道德底線。企業經營活動應該依法合規進行,在追求經濟利益的同時,既要遵守法律法規,更要守住道德底線。
再次,個人要提高自我數權保護意識,在上網購物、使用手機應用的時候,多留意冗長的格式化「隱私」申明,避免不法商家在你不注意的情況「被動授權「你的隱私數據的授權使用。
E. 大數據背後的技術、商業和社會維度
大數據背後的技術、商業和社會維度
要想考察大數據最好同時考察大數據背後的技術、商業和社會維度。從發展成熟度來看,技術維度走的最遠、商業維度有所發展但不算全面成熟,社會維度發展最差。所以雖然已經談了很久大數據,但除了孕育出大數據自身的幾個領域比如搜索等,其它領域卻並沒有從大數據中獲得可見的收益。大多時候人們還是處在覺得這里肯定有金子,但需要更多的耐心的狀態。這篇文章則嘗試對大數據本身的特徵做點挖掘,對未來的發展趨勢做點預測。
大數據上的深度和廣度
如果把大數據對應到海量的數據,那它就是非常含糊的概念,相當於變成信息的同義詞,顯然也就很難回答信息到底能幹什麼這樣的問題。
這時候為了推進思考通常需要先分類。如果把時間空間作為最基本的視角,那首先要區分的就是大數據的深度和廣度。從時間的角度看大數據是完整的歷史,從空間的角度看大數據是全球活動的痕跡。前者可以看成一種深度,後者可以看成一種廣度,不同的場景對深度和廣度的側重有所不同。
對於有些垂直的行業,比如醫療,大數據的深度更重要,所有的歷史都可以在數據上得到找到之後,人們就可以更好的認知並優化相應的行業。
對社會而言,很多時候廣度則更重要,具體到某個場景我們只有一鱗半爪的消息,但當這種信息足夠多,范圍足夠廣,就有可能描述出相對及時的全貌。經常舉的Google預測傳染病的例子依賴的就是這種廣度。
這點決定了大數據的應用發展趨勢,在深度重要的地方,公司這類組織需要成為主體,困難是如何跨越數據所有權的邊界。對於醫院而言,顯然把所有治療案例數據化並共享是有好處的,但如果只有一個醫院這么做,那對這一家醫院而言更多的可能是隱私上反彈所帶來的壞處。
在廣度重要的地方,雖然在搜索這樣的領域里公司也可以受益,但真正可以從大數據全面受益的機構其實是政府。數據越廣,其所描述的主體就越大,而如果描述的是整個社會,那顯然應該是社會的主要責任人會從中受益。這是個常識問題,就和看病的時候不會吃了醫生給別人開的葯自己反倒好了差不多。有的時候央視會播放網路做的春節期間人員流動圖,這件事情也正好可以從側面說明這問題。這種人員流動地圖對能做出地圖的人公司幫助遠沒有對政府的幫助大。
深度和廣度兩個方向對數據的要求不同,前者需要更為詳盡、有質量的數據源後者則對此要求不高,但兩者在應用的時候都會面臨付出回報不對等問題。大數據傾向於描述整體,而有能力收集或處理大數據的往往是個體,個體的回報在整體的提升中並不容易獲得清晰體現。
現在大數據發展的瓶頸不是技術,而是背後所需要的分配關系的建立。這種關系理不順,數據就會停留在孤島層面,每個組織都有自己的東西,並把它命名為「大數據」。而為了理順這種關系則要回到一個非常經典的問題,「公地」到底可不可以建立。
數據公地的設想
大數據其實有點像公地,在經濟學里非常出名的一個論點是公地悲劇。《美國經濟史》舉了一個非常易懂的例子來說什麼是公地悲劇:
這些經濟推理命題有利於解釋集體所有制和產出的共享(平分或固定份額)如何導致「免費搭車者」問題。為了說明這一點,考慮共享土地所有權,且共同生產了100蒲式耳玉米的10個工人,平均每人消費10蒲式耳玉米。假設一個工人開始偷懶並將其勞動努力減半,從而導致產出減少5蒲式耳。由於產出共享制度的安排,偷懶者的消費量和其它工人一樣,現在都是9.5蒲式耳。盡管他的努力已經下降了50%,但他的消費量只下降了5%。偷懶者是在搭他人勞動的便車。…
這背後有非常深刻的人性問題,即使我們可以通過努力協作創造更多的財富,個人也可以從中分享更多,但在群體里明顯的個人傾向則是自己工作更少但分享更多。這與囚徒困境其實是相通的。
基於實物的世界裡眼下看不到徹底解決這問題的方法,只能依賴於某種被大家基本認可的分配秩序,比如:以前的血統現在的物競天擇,但基於比特的數字財富眼下看卻有解決這問題的可能。
基於比特的數據與實物最大的區別是數據並非是你拿走我就沒有的東西,並且硬體的價格在飛速下降,開源又使數據的訪問工具基本免費。這幾者疊加在一起,使數據公地成為可能。
如果大家更在意我拿到的東西是不是絕對值變大了那數據公地的形成可能性就大些,因為如果存在數據公地,那每個人(企業)一定收獲更多,但如果大家更在意我是不是比你多,那數據公地的建設就會多很多障礙,因為公地其實是讓相關人員站到同樣的競爭起點上。
大數據整合營銷專家羅百輝認為,大數據的問題,在數據的使用上是技術問題,但在數據源上其實是社會經濟問題,後者更難,所以大數據應用的發展不取決於技術的發展而取決於社會經濟方式的變革速度。在有限的領域里,比如搜索、電商、雲計算,技術已經得到比較充分的發展,眼下來看誰付出誰受益的問題是把小數據變成大數據過程中最主要的問題。
大數據的路往那裡走?
數據的內在發展動力是數據越全價值越大,其實這也是一種網路效應,這種內在動力導致宏觀來看數據所有權的發展只有兩種趨勢:
一種是像現在移動端一樣,每個人都有自己的私有數據源,接下來開始你死我活的競爭,最終有一家活下來,這也可以達成數據統一的終極目標。
另一種則是在競爭中開始聯合,建設上面所說的數據公地。
如前所述行業數據和全社會的數據性質上差別很大所以要分開來探討。
對於行業數據而言,競爭對手間彼此的坦誠合作除非有極為特別的人物出現,否則是不太可能的。這種情況下最簡單的辦法是引入第三方。
比如說每家運營商都握有幾乎所有網民的行動數據,但要想讓運營商彼此間開誠布公的合作把這些數據整合在一起創造某種價值,這就很難。這時候如果有第三方介入,制定好利益分配方案那就是可能的。
如果這點可以達成,那唯一的關鍵點就是相應的商業模式是不是可以超越數據處理的成本。這點必須強調下的是,大數據的價值密度是很稀疏的,很多東西有價值但並不一定值得做,視頻網站之所以賺不到錢一個關鍵原因就是帶寬和存儲的成本比較高,而對大數據而言商業模式找不好,情形可能比視頻網站還差。挖礦的成本怎麼也要小於挖礦所得挖礦才有價值。
上述問題在行業數據里可能問題還不是太大,一般來講行業數據的價值密度終究會大一些,並且因為相對比較垂直,總量終究有限制。所以大數據的行業應用比較容易發展。
但對社會性的數據,這在很多時候就是個問題。我們都知道樣本的全面性比數據的多少更有價值,但是如果多是確保樣本全面性的唯一手段的話,那就意味必須有全的數據做一件事情才有意義。
社會化的數據有兩種應用方向,一種就是企業可以搞定的比如Google,一種則是屬於社會層面,很難單獨屬於某個企業的比如智慧城市相關的人的活動數據。後者則需要上面所說的數據公地來做支撐。
從數據的視角來看,現在有兩種數據存放形式:一種是Google這樣的企業擁有整個社會某個橫截面上的全部數據,這應該是種特例,並且數據會局限在公開信息;一種則是被割裂的各種與人行為相關的數據,比如購物相關的在電商,與人相關的在社交網路和IM,線下服務相關的則在O2O企業,鐵路相關的在12306等。Google這種擁有全的數據,但並不擁有人的行為,所以說Google這種企業相當於擁有整個社會的一個橫截面的數據。而所有其它企業則只擁有某個垂直領域的數據。
如果依賴於企業做這種數據統一的嘗試,在前者就會有投資200億做O2O類的舉動,因為這會補全數據,在後者就會有做電商的想做社交,做社交的想做電商這類事發生。類似的故事還可以在終端上發生,所有這些行為的終極目標都是一家企業搞定所有這些事情,但這是不可能的,這種不可能還不單是經濟原因。而數據不能打通,那就只能在割裂的數據上做自以為是大數據的大數據。
所以說這骨子裡是數據公地究竟能不能建立的問題,而要想建立數據公地,那至少要解決誰來做的問題,對此開源給出的啟示有兩點非常關鍵:第一這不能是個盈利組織;第二這要能獲得眾多企業的支持。因為數據會牽涉隱私,所以同開源相比那就一定還要有比較清晰的界定數據使用的規則。
在有一種切實的辦法解決數據所有和使用權之前,大數據的應用應該還都是局部的。因為它的深度應用牽涉社會很多部分的彼此協調,所以這個過程可能是非常漫長的。這裡面有意思的事情是,大數據的出現直接推動了機器智能的發展,而機器智能產生影響的速度可能會遠快於大數據本身。
以上是小編為大家分享的關於大數據背後的技術、商業和社會維度的相關內容,更多信息可以關注環球青藤分享更多干貨
F. 如何有效的進行數據治理和數據管控
大數據時代的到來,讓政府、企業看到了數據資產的價值,並快速開始 探索 應用場景和商業模式、建設技術平台。但是,如果在大數據拼圖中遺忘了數據治理,那麼做再多的業務和技術投入也是徒勞的,因為很經典的一句話:Garbage in Garbage out。
當你處理或使用過大量數據,那麼對「數據治理」這個詞你一定不會陌生。你會思考數據治理是什麼?數據治理是否適合你?如何實施。簡單來說,數據治理就是處理數據的策略——如何收集、驗證、存儲、訪問、保護和使用數據。數據治理也還包括誰來查看,使用,共享你的數據。
隨著大數據時代的推進,以上這些問題日益突出,越來越多的企業依賴採集、治理、儲存和分析數據,並實現他們的商業目標。數據變成了企業的盈利工具、業務媒介和商業機密。數據泄露會導致法律糾紛,還會令消費者對公司的核心業務失去信心。
如果抱著僥幸的心理,讓各個業務部門自己管理數據,那麼你會缺乏有效的數據管理,甚至各部門會自己做自己的。你無法想像各個部門按隨心所欲地自己生產、儲存、銷售產品。數據使用不當就像庫存使用不當一樣,會給企業造成沉重的損失。因此必須制定一項測量用以保證所需數據的有效和安全,可用性,這就是我們要談的「數據治理」。
數據治理策略必須包含完整的數據生命周期。策略必須包含從數據採集、清洗到管理,在這個生命周期內,數據治理必須要有關注以下內容:
數據從哪裡來,數據怎麼來
這是數據生命周期的起點。數據來源決定了數據治理策略的基礎。例如數據集的大小就由數據來源所決定。是從目標市場、現存用戶和社交媒體收集數據?還是使用第三方收集數據或者分析你收集的數據?輸入數據流是什麼?數據治理必須關注這些問題,並制定策略來管理數據的採集,引導第三方處理他們收集的數據或者分析你收集的數據,控制數據的路徑和生命周期。
數據校驗
通常數據源都是非常龐大且多樣的,這是一個讓數據管理者非常頭疼的問題。將數據噪音和重要數據進行區分僅僅只是開始,如果你正從關聯公司收集數據,你必須確保數據是可靠的,對於那些幾萬、幾十萬、甚至成百上千萬的復雜關系數據,單靠人為的通過Excel對進行數據清洗已經不太現實,需要專業的數據清洗工具或系統對海量復雜關系數據進行批量查詢、替換、糾正、豐富以及存儲。將元數據、主數據、交易數據、參考數據以及數據標准內置固化到數據清洗工具或系統中,結合組織架構、內容管控、過程管控等管理機制、技術標准提高數據治理人員的工作效率。比如:需要手工編寫程序收集的元數據,系統幫你自動獲取;需要人工識別或編寫代碼實現的數據質量檢查,系統幫你自動識別問題;用文檔管理的數據字典,系統幫你在線管理;基於郵件和線下的流程,系統幫你線上自動化。當然,系統並不是萬能的,數據治理的軟體工具與其他軟體工具一樣,沒有什麼神奇之處,沒有數據治理人員的參與和數據治理工作的推進,軟體再完美也無法完成數據治理整個過程。這也是為什麼數據治理咨詢服務一直有其市場,以及為什麼國內大部分單純數據治理軟體項目未能達到預期目標。
數據治理必須解決存儲問題
而數據存儲和數據集的大小有密切關系。大數據的存儲必須是在安全的冗餘系統之中。常常利用層次體系,根據使用頻率來存儲數據。這樣一來,昂貴的在線系統提供的是被頻繁請求的數據,而請求頻率較低的數據則存儲在便宜,可用率較低的系統上。當然,一些請求頻率低但是敏感的數據如果存儲於安全性較低的系統上,風險會大大提升。因此,在制定數據存儲方案時,良好的數據治理策略必須考慮到方方面面的因素。
數據治理必須建立訪問管理制度,在需求和安全性找到平衡點
明確訪問者的許可權,只能訪問他們對應許可權包含的數據。只有合法請求才能夠訪問數據,而敏感的數據需要更高的許可權和更嚴密的驗證才可以被訪問。只向具有特定安全級別的用戶開放。應該對用戶和數據本身設置訪問級別,管理賬戶時,應與人力資源部和采購部緊密互動,這一點非常重要,因為這樣可以及時地使離職員工和停止合作的供應商不再擁有訪問許可權。處理好這些細節以及確保數據所有權和責任,這是構成完整的數據治理策略的一部分。
數據的使用/共享/分析
如何使用數據是數據治理之後一項重要的內容,數據可能會用於客戶管理,提高客戶體驗,投放定向廣告,用戶應用系統初始化基礎數據工作,輔助應用系統建設,提供市場分析和關聯公司共享數據。必須仔細界定哪些數據可用於共享或者用於營銷,並保護它們免遭攻擊和泄露,因為數據本來就應該被用於純粹的內部用途。讓用戶知悉採集數據的所有公司都會遵守數據安全和保證的規定。能夠確保數據被合理合規的使用,也是數據治理重要的一項內容。
收集、驗證、存儲、訪問和使用都是數據安全計劃的必要組成部分
收集、驗證、存儲、訪問和使用都是數據安全計劃的必要組成部分,必須要有一個全面的策略來解決這些問題以及其他安全問題。數據安全計劃必須是有效且可用性高,但是數據生命周期的所有部分都很容易受到攻擊和由於粗心造成的破壞。你必須在數據治理中確定數據安全計劃,包括訪問控制,靜態數據,數據加工,數據傳輸之後的加密等。
管理/元數據
沒有管理的數據生命周期是不完整的。例如,將元數據應用於一段數據,用來進行識別檢索。元數據包含數據的來源,採集或生成的日期,信息訪問的級別,語義分類及其他企業所必須的信息。數據治理能建立一個元數據詞彙表,界定數據的有效期。請注意數據也會過期,過期之後我們只能用於 歷史 數據的分析。
數據治理創建的過程中可能會在企業內部遭到一些阻力,比如有的人會害怕失去訪問數據的許可權,而有些人也不願意和競爭者共享數據。數據治理政策需要解決上述問題,讓各方面的人都可接受。習慣了數據筒倉環境的公司,在適應新的數據治理策略上面會有困難,但如今對大型數據集的依賴以及隨之而來的諸多安全問題,使創建和實施覆蓋全公司的數據策略成為一種必然。
數據日益成為企業基礎設施的一部分,在企業一步步處理各種特定情況的過程中形成決策。它以一次性的方式作出,常常是對某一特定問題的回應。因此,企業處理數據的方法會因為不同部門而改變,甚至會因為部門內部的不同情況而改變。即使每個部門已經有一套合理的數據處理方案,但這些方案可能彼此沖突,企業將不得不想辦法協調。弄清數據存儲的要求和需求是一件難事,如果做得不好,就無法發揮數據在營銷和客戶維系方面的潛力,而如果發生數據泄露,你還要承擔法律責任。
另外在大企業內部,部門之間會展開對數據資源的爭奪,各部門只關注自身的業務情況,缺乏全局觀念,很難在沒有調解的情況下達成妥協。
因此公司需要一個類似數據治理委員會的機構,他的職責是執行現有數據策略、挖掘未被滿足的需求以及潛在安全問題等,創建數據治理策略,使數據的採集、管護、儲存、訪問以及使用策略均實現標准化,同時還會考慮各個部門和崗位的不同需求。平衡不同部門之間存在沖突的需求,在安全性與訪問需求之間進行協調,確保最高效、最安全的數據管理策略。
建立數據治理委員會
負責評估各個數據用戶的需求,建立覆蓋全公司的數據管理策略,滿足內部用戶、外部用戶甚至法律方面的各種需求。該委員會的成員應該囊括各個業務領域的利益相關者,確保各方需求都得到較好地滿足,所有類型的數據所有權均得到體現。委員會也需要有數據安全專家,數據安全也是重要的一環。了解數據治理委員會的目標是什麼,這一點很重要,因此,應該思考企業需要數據治理策略的原因,並清楚地加以說明。
制定數據治理的框架
這個框架要將企業內部、外部、甚至是法律層面的數據需求都納入其中。框架內的各個部分要能夠融合成一個整體,滿足收集、清洗、存儲、檢索和安全要求。為此,企業必須清楚說明其端到端數據策略,以便設計一個能夠滿足所有需求和必要操作的框架。
有計劃地把各個部分結合起來,彼此支持,這有很多好處,比如在高度安全的環境中執行檢索要求。合規性也需要專門的設計,成為框架的一部分,這樣就可以追蹤和報告監管問題。這個框架還包括日常記錄和其他安全措施,能夠對攻擊發出早期預警。在使用數據前,對其進行驗證,這也是框架的一部分。數據治理委員會應該了解框架的每個部分,明確其用途,以及它如何在數據的整個生命周期中發揮作用。
數據測試策略
通常一個數據策略需要在小規模的商用環境中進行測試,用來發現數據策略在框架,結構和計劃上的不足之處並進行調整,之後才能夠投入正式使用。
數據治理策略要與時俱進
隨著數據治理策略延伸到新的業務領域,肯定需要對策略進行調整。而且,隨著技術的發展,數據策略也應該發展,與安全形勢、數據分析方法以及數據管理工具等保持同步。
明確什麼是成功的數據策略
我們需要確立衡量數據治理是否成功的明確標准,以便衡量進展。制定數據管理目標,有助於確定成功的重要指標,進而確保數據治理策略的方向是符合企業需求。
無論企業大小,在使用數據上都面臨相似的數據挑戰。企業越大,數據越多,而數據越多,越發需要制定一個有效的,正式的數據治理策略。規模較小的企業也許只需要非正式的數據治理策略就足夠了,但這只限於那些規模很小且對數據依賴度很低的公司。即便是非正式的數據治理計劃也需要盡可能考慮數據用戶和員工數據的採集、驗證、訪問、存儲。
當企業規模擴大,數據需求跨越多個部門時,當數據系統和數據集太大,難以駕馭時,當業務發展需要企業級的策略時,或者當法律或監管提出需求時,就必須制定更為正式的數據治理策略。