Feature Store terimini değişken ambarı ya da öznitelik mağazası ya da değişken deposu olarak çevirebiliriz. Ancak bu yazımda terimin İngilizce hali ile devam edeceğim. Şimdi konumuza geçelim.

Bildiğimiz gibi herhangi bir makine öğrenmesi (ML) projesi için özellik mühendisliği (feature engineering) oldukça karmaşık olan kritik bir konuma sahiptir. Unutmayalım ki doğru bir süzgeçten geçirilerek oluşturulan değişkenler daha iyi modeller çıkarmamıza imkan sağlar. Öte yandan yeni bir değişken oluşturmak oldukça zahmetli bir iştir ve bu değişkenin geçtiği yolların (pipeline) kurulması ise işin bizim için başka bir zorlayıcı boyutu. O güzelim değişkenleri elde edene kadar bir çok farklı deneme yanılma süreçlerinden geçiyoruz ta…


Data Governance Türkçe çevrisi ile Veri Yönetişimi olarak bilinir. Bu kavramın bir kurum içerisinde ön planda yer alabilmesi için adına Veri Bakanlığı denilseydi emin olun herkes bu bakanlıkta çalışmak isterdi :).

Photo by Benjamin Child on Unsplash

Gelin yakışıklı bir sözlük tanımı yapalım.

Veri yönetişimi, bir organizasyonun hedeflerine ulaşabilmesinde etkili ve efektif bilgi kullanımını sağlayan süreçlerin, prosedürlerin, rollerin, politikaların, standartların ve metriklerin toplamından oluşur.

Bu disiplin kurumlar için süreçlerin ve sorumlulukların yer aldığı odağında kalite ve güvenliği barındıran bir yapı kurar. Veri bakanlığı (veri yönetişimi), kimin dataya nasıl erişeceğine, ne için ve hangi ortamda kullanabileceğine karar verir.

İsmi Veri Müsteşarlığı da olabilirmiş :).


Photo by an_vision on Unsplash

Bu yazıda biraz beyin fırtınası yapalım. Şu soru ile başlarsam sanırım kısa yoldan argümanımı anlatmış olacağımı tahmin ediyorum.

Apple müşterilerini dinliyor mu? yoksa şunu mu söylüyor “ben buyum, sınırlarımı zaten biliyorsun , belli bir marka çizgim var sunduğum ürün bu ister al istersen alma.”

Apple bir insan olsa aramızda şöyle bir konuşma geçerdi:


Cohort (Kohort) analizi müşteri yolculuğunda yaşam boyu değerinin farklı yönlerden ele alabileceğiniz esnek bir bakış açısı sunmaktadır. Bu analiz yöntemini ilk kez Google Analytics üzerinde gördüm ve o anda aşık oldum. Sonra hiç aklımdan çıkaramadım. Bu yazı çerçevesinde öncelikle Cohort analizin tam olarak ne olduğundan bahsedip ardından Python üzerinden nasıl yapılacağını anlatacağım.

Cohort (Kohort) analizi aslında tıp alanında hastaların akciğer sağlığını ölçümlemek için kullanılır. Doktor hastadan Kohort-kohort-kohort diyerek öksürmesini ister. Eğer bu öksürükte ‘h’ harfi çıkmaz ise bunu bir semptom olarak değerlendirir desem yalan olur. Böyle bir şey yok ama neden olmasın :) ?

Cohort (Kohort) Analizi Nedir?

Pazarlama dünyasında müşteri yolculuğu ile kesişen…


Photo by Robert Thiemann on Unsplash

Nasıl ki Javascript dilinin Java ile bir alakası yok ise NoSQL yapısının da SQL ile bir ortaklığı söz konusu değildir. Tarihsel olarak baktığımızda NoSQL’in tasarımcısı olan Carlo Strozzi bu isim yerine aslında NoREL (No Relation, İlişkisel olmayan) demişti. Ancak Cario ve arkadaşları arasında geçen aşağıdaki konuşma ile durumlar değişti. :)


Photo by Sonika Agarwal on Unsplash

Siz hiç anketörlük yaptınız mı? Cevabınız ne olursa olsun hepimiz bunu meslek olarak yapmasak bile gündelik hayatımızda yeni tanıştığımız insanlara istemeden de olsa yapıyoruz. Tabi duyu organlarımızdan gelen girdi veri setleri ile bunu sık sık yaparız…

Şimdi hafif tenha bir parkta olduğunuzu ve bankta sıcak güneşin altında otururken meltem kıvamında tatlı bir esinti hissettiğiniz o anda (romana bağladım :)) karşıdan birisinin size doğru geldiğini hayal edin. Hemen algıların aşağıdaki sorular ile anketörlük yapar.


Photo by Robert Lukeman on Unsplash

Çokta yeni sayılmaz ancak birkaç senedir hayatımızda olan bir kavramdan bahsetmek istiyorum bu yazımda; nam-ı diğer Continuous Intelligence (CI). Bu iki kelimeyi arka arkaya 5 defa söylerseniz önünüzdeki nesnelerin sihirli bir biçimde havalandığını görebilirsiniz.

Normalde elimizde ne vardı? Business Intelligence (BI). Peki bu iki kelimenin karşılığını ne olarak biliyoruz. İş zekası, aslında iş istihbaratı olarak çevrilmesi daha doğru bir yaklaşım olabilirdi. Amerika’da yer alan CIA (Central Intelligence Agency) kelimesini nasıl çeviriyoruz: Merkezi Haber Alma Acentesi şaka şaka Teşkilatı ya da İstihbarat Servisi. Olsun biz iş zekası olarak sevdik öyle kanıksadık artık yapcak bişi yok. Gerçi istihbarat adının verilmesi çok komik…


Photo by JJ Ying on Unsplash

Sizin hiç botu hattınız oldu mu? Belki fiziksel olarak A noktasından B noktasına erişen bir boru hattınız olmadı ancak dijital olarak web servisler veya API’ler inşa edebilirsiniz.

Bu yazımda makine öğrenmesinde pipeline (boru hattı) konusunu enine boyuna irdelemeye çalışacağım.

Az buçuk veri bilimi ve makine öğrenmesi hakkında fikir sahibi olduğunuzu düşünerek yazıya devam edeceğim.

Bildiğiniz üzere makine öğrenmesinde bir çok farklı aşama mevcut. İşte veri hazırlığı, verinin yıkanması, verinin durulanması, modelleme, modellerin kurutulması vs. Sesli düşünelim veriyi aldık biraz işledik. Gerekesiz kolonları ve satırları ayıkladık missing value’ları doldurduk. Ardından modelledik. Aaa süper bir Random Forrest algoritması ile train üzerinden %95…


Photo by Drew Perales on Unsplash

Makine öğrenmesi tanrıları mucizevi bir model oluşturmadan önce İskandinavlardan gelen girdi değişkenler üzerinde adeta bir duvar ustası gibi çalışarak modele en uygun veri seti formunu yakalamaya çalışırlar. Bu aşamalardan birisi de değişken/özellik ölçeklendirme (feature scalling) yöntemidir. Bu yöntem her zaman uygulanacak diye bir yasa yoktur ancak uygulandığında içerisinde birçok teknik yer alır.

Önce neden, nasıl, kim, kiminle diye bakalım sonra Python üzerinden konuyu resmetmeye çalışacağız.

Neden Değişken Ölçeklendirme Yapılır?

Neden olmasın :) Bazı gıcık makine öğrenmesi algoritmaları özellikle mesafe/uzaklık (distance) üzerine kurgulanmış olanları doğası gereği girdi değişkenlerinin birbirleri ile aynı aralıkta ve mümkünse küçük sayılardan oluşmasını tercih ediyorlar. …

Yiğit Şener

Data Science & Others | Linkedin: https://www.linkedin.com/in/yigitsener

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store