Veri Sözlüğü: nasıl yapılır ve en iyi yöntemler

Veri sözlüğü, işletme sözlüğü olan tanımlamaları olan temel terimlerin ve ölçümlerin bir listesidir. Basit, neredeyse önemsiz gibi görünse de, işi hizalama ve karışıklığı giderme yeteneği derin olabilir. Aslında, bir veri sözlüğü muhtemelen bir veri ekibinin işletmeye sunabileceği en değerli eserlerden biridir.

Çoğu işletme, ekipler arasında farklı şekilde kullanılan veya yorumlanan en az bir konsepte, terim veya metriğe sahiptir. Bu olduğunda, karışıklık hüküm sürer. Karar vericiler verilerin ne gösterdiği ve hangi eylemlerin gerçekleştirileceği konusunda hemfikir olabilirler. Ekipler arasındaki raporlar, tutarsız iş mantığı nedeniyle aynı veri kaynağında aynı veri kaynağından farklı rakamlar gösterebilir. Takımlar doğru tanımı tartışabilir ve belki de alanlarını savunabilir, çünkü tanımları numaralarının daha iyi görünmesini sağlar. Bu iş için iyi değil.

Bir veri sözlüğünüz olduğunda, tüm personelin başvuruda bulunabileceği ve aynı sayfada olabileceği bir belgedir, yeni personeli işe almayı kolaylaştırır ve iş zekası (BI) ekibinin bu metriklerin uygulanması için net gereksinimleri vardır.

Açık olmak gerekirse, burada da önemli olmasına rağmen ham veritabanı tablosu dokümantasyonunu düşünmüyoruz, ancak daha üst düzeyde bir iş şartları ve ölçüm listesi. İşletmeler bir bütün olarak “kullanıcı”, “gelir” veya “satın alma maliyeti” hakkında ne düşünüyor? Herkes aynı anlayışa veya “satış bölgesine”, “ortalama gemi zamanına” veya “oturumuna” sahip midir? Amaç, müşteri hizmetleri temsilcisi gibi teknik olmayan küçük bir personelin, işin bir kısmı için bölümü okuyabilecek ve ilgili şartları anlayabilmesi, ancak iş mantığını yakalamak için yeterince ayrıntılı ve doğru olması gerekir. bu metriklerin.

Bu yayında, veri sözlüklerini çevreleyen bazı en iyi uygulamaları ve nasıl oluşturulacağına ilişkin bir süreci ayrıntılı olarak anlatacağım. Bu kesinlikle işe yarayacak tek süreç değil ama en azından benim için çalıştı. Burada BI ekibinin bu süreci sürdüğünü varsayıyorum. Benim düşünceme göre, veri sözlüğüne ve ölçüm araçlarının BI araçlarında uygulanmasına sahip olmaları gerekir.

1. Terimleri topla

İlk adım bir terimler listesi derlemektir. Diğer bir deyişle, BI ekibi işletme konseptlerinin ve ölçümlerinin (ölçütlerin) isimlerinin ve verilerin nasıl dilimlenip bölündüğünün (boyutların) bir listesini içeren bir elektronik tablo oluşturmalıdır. Bu göz korkutucu gelse de, yaklaşımlardan biri iş ekibinin iş ekibine gitmesi ve tüm standart rapor ve gösterge tablolarının bir örneğini incelemektir. Tüm eksen etiketlerini grafiklerden, rapor tablolarından sütun başlıklarından ve verinin nasıl döndürüldüğünün boyutlarını listeler. Böylece, geliri bölgelere göre (bir süre için) gösteren bir rapor iki temel terim verir: “gelir” ve “bölge”. Bu aşamada, tanımlarını değil, sadece adların bir listesini derliyorsunuz.

Çıktı, takım adı, terim adı, veri türü, örnek bir veya iki değer listesi ve belki de bu terimi kullanan örnek bir rapora bir bağlantıdır. Eklemek için kullanılabilecek ek sütunlar, bunun bir boyut mu yoksa ölçü mü (ölçülerden genellikle ölçülerden daha fazla anlaşma olduğunu) belirten bir sütun ve hakikat kaynağını belirten bir sütundur.

1. Adım: tanımsız bir terim listesi

Listeyi, finansal ölçütler, pazarlama ölçütleri, müşteri hizmeti ölçütleri vb. kendi bölümlerine de takımlar.

Liste muhtemelen beklediğiniz kadar uzun değildir. Bunun nedeni, ekiplerin emrinde nispeten küçük bir kaldıraç kümesiyle izlemeye ve optimize etmeye çalıştıkları nispeten küçük bir ölçüm kümesi olma eğiliminde olmalarıdır. harcamak ve segment.

İş ekibinden listeye, özellikle de bölümlerine bakmalarını ve eksik olan terimleri eklemelerini isteyin. Sağlam bir gösterge tablosu ve rapor kümeleri varsa, muhtemelen kapsamlı bir listeniz vardır. Olmazlarsa, bu, toplanması değerli olan ek kavramlar sağlar.

2. Terimleri tanımla

BI ekibi şimdi tanımlamalar oluşturmaya veya oluşturmaya çalışırken ilk adımını atmalıdır.

İlk önce, var olan herhangi bir belgeden tanımları alın. Bu bir wikiden, yıllık raporlardan veya SQL sorguları veya Excel makroları gibi gerçek koddan olabilir. Tanımlar açık ve net olmalıdır. Eğer bir tanım yazmak yerine basit bir formül (ARPU = total_revenue / number_subscribers gibi) göstermek daha açıksa bunu gösterin. Çoğu personel, bazı terimleri referans almaları gerekse bile tanımı anlayabilmelidir.

İkincisi, takımlarla birer birer oturun ve eksik tanımları belirlemek veya tanımları düzeltmek için yardımlarını isteyin. (Bir tanımla başlayarak, yanlış olsa bile, boş bir hücreden daha iyi bir ilerleme elde edersiniz.) Bu, o takım içinde bir anlaşma yapana kadar ileri geri biraz ileriye ihtiyaç duyabilir. Ayrıca, bir metriğin şu anda nasıl hesaplandığı konusunda biraz araştırma gerektirebilir.

En önemlisi, “mevcut tanım nedir?” Değil, “bu nasıl tanımlanmalı?” Diye sormayın. Eğer mevcut uygulama ideal tanımı değilse, iş ekibinin ideal durumlarını ortaya koymaları için mükemmel bir fırsat bu. Örneğin, bu aşırı karmaşık bir tanımı miras aldıysanız basitleştirmek için bir şanstır. Bu ideal tanım yakalandıktan sonra, veri ekibi, teknoloji ekibi veya işin diğer bölümleri üzerinde tanımlandığı gibi bu metriğe ulaşma konusunda ek bir baskı vardır.

3. Çatışmaları tanımlayın

Bu kilit bir adımdır: tanımının ekipler arasında farklılık gösterdiği terimleri ortaya çıkarın.

4. Hizalamayı alın

Takımlar arasında farklılık gösteren terimler için, ilgili takımları aynı odaya getirin (ve kapıyı kilitleyin). Neden ve neden farklı olduklarını tartışmalarını isteyin.

Bu toplantı için sadece 2 sonuçla anlaşılmalıdır:

* bir takım diğer takımın tanımını kabul etmeyi kabul eder.

* Farklı olmalarının meşru sebepleri var. Bu durumda, terimlerden biri veya ikisi için yeni bir isim üzerinde anlaşın.

(Her iki takımın da tanımlarını bazı ortak tanımlara değiştirmeye karar verdiği üçüncü bir seçenek mümkün, ancak daha az olasıdır.)

İsimler belirsizliği veya karışıklığı önlemek için gerektiği kadar uzun olmalıdır. “Community_adjusted_editba”, onu normal “ebitda” dan ayıran daha uygun ve uygun bir terim ise, daha uzun, daha açıklayıcı bir terim kullanın. Amaç, titiz olmamak için karışıklığı ortadan kaldırmaktır.

5. Oturumu kapatın

Takım kafalarını imzalattırın. Bu çok önemli. İş Zekası ekibinin bir terim tanımlamasını istemezsiniz ve iş ekibi gizlice aynı fikirde değildir. Bu durumda, iş Excel'e gidip kendi mantığını uygular ve ilk kareye geri dönersiniz. Etki alanı uzmanları ve bu ölçümlere dayanarak iş kararları verecek kişiler olarak, bu işletme sahiplerinin tamamıyla gemide olmaları gerekir.

Warby Parker'da, eş başkanların imzasını almak ve belirli bir tarihte bunu yapmak için ortak CEO'ların yardımından yararlandık. Takım başkanları meşgul ve bir veri sözlüğü değeri görebilse bile, en öncelikli görünmeyebilir. Böylece bu yukarıdan aşağıya destek çok değerli oldu.

6. Yayınlayın

Veri sözlüğünü, sadece bir BI aracında değil, tüm şirketin erişilebilir olduğu tek bir sayfa belgesi olarak yayınlayın. Bu tanımlar, sadece uygulayıcılar, analistler ve karar vericiler tarafından değil, tüm personel tarafından anlaşılmalı ve kabul edilmelidir. Bu nedenle görünürlük çok önemlidir. Eğer şirket yoğun bir wiki kullanıyorsa, orada yayınlarlar. İnsanların beklediği yerde olmalı.

Kavramsal olarak, bu terimler tek bir sistemden veya veri kaynağından bağımsızdır ve bu nedenle bir BI aracına bağlı değildir. Ancak, münferit tanımlar mümkün olduğunda BI araçlarına da yazılmalıdır. Araç bunu destekliyorsa, bir boyut veya ölçü üzerinde fareyi hareket ettirdiğinizde, tanım ve örnek açılır.

Bu tanımların birden fazla yerde görünebileceği göz önüne alındığında, veri ekibi veri sözlüğünü, statik bir tabloyu el ile tutmak yerine, veri tabanı tablosu veya kod deposu gibi tek bir kaynaktan otomatik olarak oluşturmaya çalışmalıdır. Örneğin, Warby Parker'da veri sözlüğümüz bir Jenkins işinden üretildi. Depo değiştirilmişse, dokümantasyonumuzu (tüm veri dokümantasyonu için özel bir dahili web sitesi veya “veri kitabı”) yenilemiştir.

7. koruyun

Temel metrikler nispeten istikrarlı olsa da, bir metrik tanımının neden değişmesi gerekebileceği meşru ticari nedenler olabilir. Bu değişim ve yeni tanım iş ekibinden gelmelidir. Ancak, değişikliği uygulamak ve iletmek için veri ekibinin yardımına ihtiyacı olacaktır.

İş Zekası ekibi, değişimin yayılmadan önce etkisini değerlendirmelidir. Örneğin, sayıların nasıl değişebileceğine dair beklentileri belirlemek için metriğin hem eski hem de yeni tanımını içeren metriği gösteren bir grafik hazırlayın.

Bu tanım değişikliğine bir ürün sürümü gibi davranın: tanım değişikliğini önceden iletin, insanlara ne bekleyeceğini söyleyin ve belgenin altındaki değişiklik günlüğü gibi veri sözlüğündeki değişikliği belgeleyin.

Farklı sistemlerin senkronizasyondan çıkmasına izin vermeyin; Bu nedenle, neden otomatik dokümantasyon oluşturma değerlidir.

Yukarıdaki süreci izleyen bir veri sözlüğü oluşturmak küçük bir çaba değildir. Birçok personel arasında görüşme ve koordinasyon gerektirdiğinden muhtemelen birkaç ay sürecektir. BI ekibi tarafından yönlendirilen ve koordine edilen, ancak geniş satın alma, işbirliği ve çaba ve yukarıdan aşağıya takviye gerektiren geniş bir ekip çalışmasıdır.

Sürecin parça parça alınmasını önermiyorum. Örneğin, daha sonraki bir tarihte veri sözlüğünü finanse etme beklentisiyle tamamen pişmiş bir pazarlama veri sözlüğü oluşturmayın. Bu, ekipler arasında bu (4. adım) uyum tartışmalarına gitmeyi zorlaştırır ve gerçek kazancın gerçekleştiği yer burasıdır. Ayrıca sıralı yapı, buhar kaybını kolaylaştırır. Hedefe ulaşmak için ortak bir bitiş tarihi olan takımlar arasında eşzamanlı tartışmalara ihtiyacınız var.