Skip to content

Veri Bilimi Bülteni — 2

Uzun bir süredir veri ve veri bil­i­m­ini (veri, veri bil­imi, veri maden­cil­iği, makine öğren­mesi, veri görselleştirmesi, veri gazete­celiği) içere­cek konu­larla ilgileniy­o­rum. Geçen hafta itibariyle bu konu­lar hakkında okuduk­larımı düzenli olarak pay­laşma kararı almıştım ve bu da hazır­ladığım 2. bül­ten. İyi oku­malar… Airbnb’in fiy­at­landırma sis­te­minde makine öğren­mesi kul­lanıldığını biliyor muy­dunuz? Airbnb’de ‘Prod­uct Lead’ olarak çalışan Dan Hill’in Devamını Oku […]

Veri Bilimi Bülteni — 1

Uzun süredir veri ve veri bil­i­m­ini kap­say­a­cak konu­larla (veri, veri bil­imi, veri maden­cil­iği, makine öğren­mesi, veri görselleştirmesi, veri gazete­celiği) ilgileniy­o­rum ve (eğer becere­bilirsem) artık bu konu­lar hakkında okuduk­larımı haf­talık olarak pay­laş­mayı hede­fliy­o­rum. Makine öğren­mesi ve veri bil­imi hakkında 50 adet cheat sheet - http://www.kdnuggets.com/2015/07/good-data-science-machine-learning-cheat-sheets.html Bayes Teorimi kul­la­narak Real Madrid forvet­lerinin Devamını Oku […]

Bertrand Russell’in Aylaklığa Övgüsü

Bertrand Russell’in Aylak­lığa Övgü isimli kitabı bir süredir oku­nacak­lar lis­temde bek­liy­ordu ve sonunda oku­maya başladım. Bu kitabın başlığı her ne kadar Aylak­lığıa Övgü olsa da aslında felsefe, eğitim, siyaset, ekonomi, sosy­oloji gibi farklı konu­larda Bertrand Russell’ın farklı yer­lerde yazdığı den­emeleri içeren bir kitap. Ben bu yazıda kitaba ismini veren yazı­dan bahsede­ceğim. Aylak­lık nasıl övülür diye düşünerek başladım kitabı oku­maya fakat Bertrand Devamını Oku […]

Büyük Sayılar Yasası ve Kumarbazın Yanılgısı

Büyük sayılar yasası, bir ras­sal değişkenin uzun vad­ede bek­le­nen değere ulaşa­cağını söyler. Bunu iki farklı örnekle anlatıp, kumar­bazın neden yanıldığını ifade etm­eye çalışa­cağım. Bir­inci örnek bir zar örneği olsun; bir zarın 6 adet yüzü vardır ve her bir yüzdeki sayının toplamının orta­la­ması 3.5’tur. Bu durumda teo­rem bize zarı yeteri kadar attığımız durumda orta­la­manın 3.5’a yak­laşa­cağını söyler (bek­le­nen değer: 3.5). Yani zarı 1 kere, Devamını Oku […]

2 Yıl İçinde İlk Kafa Nakli Gerçekleşir Mi?

TEDxLi­mas­sol kon­fer­an­sında konuşan Dok­tor Ser­gio Canavero 2 sene içinde kafa nakli yapıla­bile­ceğini iddia etti. Evet, kafa nakli: bir kafanın başka bir vücuda yer­leştir­ilmesin­den bahsediy­o­rum. Dil­ers­eniz, dok­torun konuş­masının 8 dk’lık kıs­mını aşağı­daki video’dan izleye­bilirsiniz. [iframe https://www.youtube.com/embed/FV5pOO5Mt64 420 315] Teknik anlamda böyle bir şeyin şu anki teknoloji ile mümkün olup olmadığını ya da iki yıl içinde mümkün olup ola­may­a­cağını Devamını Oku […]

A/B Testlerinizi Doğru Yapıyor Musunuz?

Growth Hack­ing başlığı altında geçen olmazsa olma­zlar­dan biri de A/B test­leridir. A/B test­lerinde amaç bir­den fazla varyasy­onu test ederek hangisinin daha ver­imli olduğunu anla­mak­tır. A/B testi yaparken en çok yapılan hata­lar­dan biri de testin başarıya ulaştığını düşünerek testi erken son­landır­mak­tadır. Peki elin­izdeki örnek­lem büyük­lüğü (sam­ple size) yeteri kadar büyük mü? Örneğin A ana say­fanız 1000 üzerinden 300 tık­lama elde etmişse ve de B ana say­fanız 342 Devamını Oku […]

Eldeki Veri Sorunuzun Cevabını İçermiyor Olabilir

Veri anal­izi, veri bil­imi, büyük veri, veri maden­cil­iği gibi kavram­ların popüler­liğinin art­ması ile beraber eldeki verinin her türlü soruya cevap vere­ceği düşüncesi gibi yan­lış bir düşünce de yük­selm­eye başladı. John D Cook’un blog’unda gördüğüm John Tukey’in şu cüm­lesi de bu sıkın­tıyı dile getiriyor: The data may not con­tain the answer. The com­bi­na­tion of some data and an aching desire for an answer does not ensure that a rea­son­able answer can be extracted from Devamını Oku […]

API Kayıtlarını (Log’larını) Görselleştirerek Örüntü (Pattern) Bulmak

Web servis­leri aracılığıyla sağladığımız API fonksiy­on­larının kayıt­larını görselleştir­erek her­hangi bir pat­tern (örüntü) çıkarıp çıkara­may­a­cağımı merak ettim. Şu soru­nun cev­abını arıy­o­rum; sağladığımız fonksiy­on­lar­dan birinde gün ve saat bazında bir pat­tern var mı? Örneğin; x fonksiy­onu pazartesi günü saat 19:00–20:00 arasında düzenli olarak en az 1 kere olsa bile çağrılmış. Bu sebe­ple şöyle bir veri topladım: Burada amacım bir fonksiy­onun Devamını Oku […]

Teknik Borç Nedir? Nasıl Oluşur?

Teknik Borç Nedir? Teknik borç (tech­ni­cal debt) eksik/hatalı yazılım geliştirme süreç­leri sonu­cunda oluşan sıkın­tıları ifade etmek amacıyla kul­lanılan bir ter­imdir. Bu kavramın babası aynı zamanda wiki kavramının babası olan Ward Cunnighman’dır. Teknik Borç Nasıl Oluşur? Yazılım geliştiri­cisiniz ve siz­den yazdığınız uygu­la­maya bir özel­lik ekle­m­eniz isteniyor, kul­lanacağınız iki yön­tem var; ya hızlı bir şek­ilde kod­layıp iste­neni tes­lim ede­ceksiniz Devamını Oku […]

Veri Madenciliği Örnekleri 101

Veri Maden­cil­iği Nedir? Veri maden­cil­iği, ham verinin işlenerek bilgi elde edilmesi için kul­lanılan yön­tem­lerin bütünüdür. Elde edilen bilgi şun­lar ola­bilir: anom­ali tespiti örüntü (pat­tern) tespiti kore­lasyon Veri maden­cil­iğini uzun uzun anlat­mak yer­ine bu teknikleri kul­la­narak ortaya çıkan örnek durum­lar­dan bah­set­mek istiy­o­rum. Pazar Sepeti Anal­izi Örneği Veri maden­cil­iği 101 başlıklı çalış­malarda ver­ilen ilk örnek­ler­den biri pazar sepeti anal­izidir. Devamını Oku […]