Büyük veri nedir? ” efendim

Adından da anlaşılacağı gibi büyük veri, çok fazla veri anlamına gelir. İnterneti kullanmaya başladığımızdan beri çok büyük miktarda veri ürettik. 2003 yılına kadar sadece 5 exabyte veri üretilmişti – bu da 5 milyar gigabyte’a eşdeğerdi. Ancak 2003’ten 2012’ye kadar bu miktar 2,7 zettabayta (veya 2.700 eksabayta veya 2.7 trilyon gigabayta) ulaştı. Berkeley araştırmacılarına göre, şu anda her iki günde bir yaklaşık 5 kentilyon bayt (veya yaklaşık 4,3 eksabayt) veri üretiyoruz.

“Büyük veri” terimi genellikle, geleneksel veritabanlarını kullanarak bakımı zor olan çok sayıda, hızlı, geniş, çeşitli ve genellikle yapılandırılmamış dijital veri kümelerini ifade etmek için kullanılır. İnternette dolaşan tüm dijital bilgiler, anlaşmalı olduğumuz firmalara ait bilgiler ve ülkelerin resmi kayıtları gibi daha birçok dijital veriyi kapsayabilir. Ayrıca, bu verilerin bir şekilde analiz edildiği anlamına gelir.

Çevrimiçi satın almalar yaparak veya sosyal medyaya katılarak kendimiz hakkında birçok dijital veri üretiyoruz, ancak bu veriler buzdağının sadece görünen kısmı. Büyük veri, dijital belgeleri, fotoğrafları, videoları, ses dosyalarını, tweet’leri ve diğer sosyal ağ gönderilerini, e-postaları, metin mesajlarını, telefon kayıtlarını, arama motoru sorgularını, RFID etiketini ve barkod taramasını ve finansal işlemlerin kayıtlarını içerebilir. İnternette çevrimiçi bir şey yaptığınızda, bu, başkalarının görebileceği ve yararlı bilgilerin çıkarılabileceği dijital bir ayak izi bırakarak veri yarattığınız anlamına gelir.

Veri üreten cihazların sayısı ve türleri de hızla artıyor. Ev bilgisayarları ve perakende satış noktası sistemlerine ek olarak, internete bağlı akıllı telefonlar, ağırlığımızı tweetleyen WiFi özellikli tartı, sağlıkla ilgili verileri izleyen ve ara sıra paylaşan kondisyon sensörleri, otomatik olarak fotoğraf ve video akışı yapabilen kameralar gibi ürünler. ve sürekli hareket halindeyken uydu (GPS) aracılığıyla küresel konumlandırma cihazları. ve veri üretin. Hava durumu ve trafik sensörleri, güvenlik kameraları, araba ve uçaklardaki sensörler gibi sürekli veri toplayan kişilere bağlı olmayan diğer cihazları da unutmamak gerekir. Veri oluşturan, taşıyan ve işleyen birçok elektronik cihaz, “Nesnelerin İnterneti” kavramını doğurmuştur.
Büyük veri teriminin birçok tanımını bulabilirsiniz. Herkes kendi bakış açısından farklı bir tanım koyabilir. Çeşitli ilgi alanları doğrultusunda bilgisayar analizine konu olan tüm dijital verileri büyük veri kapsamında ele alabiliriz. Bu devasa ham veriyi toplamak, depolamak, işlemek, analiz etmek ve anlamlı verilere dönüştürmek için yeni yöntemler geliştirilmelidir.

Büyük veri nasıl analiz edilir ve kullanılır?

Büyük veriler herkesin kullanabilmesi için toplanmalı, saklanmalı, ilişkilendirilmeli ve yorumlanmalıdır. İşletmeler ve diğer kuruluşlar, kendileriyle en alakalı olanı elde etmek için mevcut verilerin büyük bölümünü filtrelemelidir. Neyse ki, büyük miktarda bilgiyi işleyebilen, depolayabilen ve analiz edebilen donanım ve yazılımlar daha ucuz ve daha hızlı hale geliyor ve bu nedenle artık büyük, pahalı süper bilgisayarlar gerektirmiyor. Bazı yazılımlar daha kullanıcı dostu hale geliyor, bu nedenle verileri analiz etmek için programcılara ve veri bilimcilere ihtiyacınız yok (yine de ihtiyaçlarınızı anlayabilecek bilgili insanlara ihtiyacınız olabilir).

İşletmeler, tüm bu verileri işlemek için kendi bilgisayarlarını satın almak zorunda kalmamak için bulut bilgi işlem hizmetlerinden yararlanıyor. Sunucu çiftlikleri olarak da adlandırılan veri merkezleri, veri parçalarını birden çok sunucuda çalışacak şekilde dağıtabilir ve sunucu sayısı gerektiği gibi hızla artırılabilir veya azaltılabilir. Ölçeklenebilir dağıtılmış bilgi işlem sistemleri, Apache Hadoop, MapReduce ve Massive Parallel Processing (MPP) gibi yenilikçi araçlar kullanılarak uygulanır. NoSQL veritabanları, geleneksel SQL tabanlı veritabanı sistemlerine göre daha ölçeklenebilir alternatifler olarak geliştirilmiştir.

Çoğu büyük veri işleme ve analiz sistemi, bilinçli kararlar vermek için kullanılabilecek veya kullanılabilecek bilgileri sağlayan modeller ve korelasyonlar oluşturmayı amaçlar. Şirketler, tüketici alışkanlıkları, ürünlerinin popülaritesi veya iş yapmanın daha verimli yolları hakkında çok miktarda veriden yararlanabilir. Büyük veri analitiği, reklamları ve ilgili ürün ve hizmetleri, bunları satın alma olasılığı en yüksek olan müşterileri hedeflemek veya genel kamuoyuna hitap etmesi muhtemel reklamlar oluşturmak için kullanılabilir. Hatta şirketler, son zamanlarda kredi kartlarını kullandıkları yerlerin yakınında akıllı telefonları aracılığıyla gerçek zamanlı reklamlar ve kuponlar göndermek gibi şeyler yapmaya başladılar.

Ancak, büyük veri sadece bize bir şey satmak için kullanılmaz. Şirketler bu bilgileri, en uygun maliyetli dağıtım yöntemlerini bulmak veya malları daha rahat bir şekilde stoklamak gibi verimliliği ve uygulamaları iyileştirmek için kullanabilir. Devlet kurumları trafik ve suç kalıplarını analiz edebilir ve politika ve hizmet kararlarını iyileştirmek için kamu hizmetleri ve diğer istatistikleri kullanabilir. İstihbarat teşkilatları bunu suçluları araştırmak ve gözetlemek için kullanabilir. Haberlerdeki trendleri bulmak ve hikaye geliştirmek için de kullanılabilir.
Özünde, büyük veri, şirketlerin geçmişte olduğu gibi çoğunlukla güncel olmayan bilgilere güvenmek yerine karar vermek için neredeyse gerçek zamanlı verileri kullanmalarına olanak tanır.

Büyük veri: dost mu düşman mı?

Büyük veri fikri de çoğumuzu endişelendiriyor. Kendimiz ve ailemizle ilgili tüm verilerin birileri tarafından bilinmesi ve işlenmesi tabi ki bazı kişiler için can sıkıcı bir durum. İnsanlar bu verilerden yaşınız, cinsiyetiniz, cinsel yöneliminiz, medeni haliniz, gelir düzeyiniz, sağlık durumunuz, zevkleriniz, hobileriniz, alışkanlıklarınız ve diğer insanların bilmesini istemeyeceğiniz birçok şey dahil olmak üzere çok şey öğrenebilir. Bu bilgileri toplamak ve analiz etmek sadece birkaç araç ve bir uygulama gerektirir. İster iyi niyetli ister kötü niyetli olsunlar, istenmeyen sonuçlara neden olabilirler.

Özellikle kredi veya banka kartı ile ödeme yapıyorsak, iş yaptığımız firmalara verdiğimizden daha fazla bilgi veriyoruz. Bankaları, sizin hakkınızda satın alımlarınızı analiz etmekten çok daha fazlasını öğrenebilir. Ne satın aldığınızı, tercihlerinizi, kullanım sürelerinizi ve hatta neye ihtiyacınız olduğunu analiz edebilir ve buna göre reklamlara geçiş yapabilir. Ancak bu bilgilerin kötüye kullanılması da mümkündür. Bu bilgilerin kötü niyetli kişilerin eline geçmesiyle birlikte başınıza gelmesini istemediğiniz birçok şey başınıza gelebilir.

Hükümetler ve mahremiyet savunucuları, bireylerin kamuya açık bilgilerini kontrol edebilmeleri için bireylerin kişisel bilgilerinin nasıl kullanıldığını düzenlemek için girişimlerde bulunuyor. Ancak akıllı yöntemlerle, şirketlerin sizin hakkınızda dolaylı olarak bir şeyler yapmasına ve dijital kaynaklardan toplanan çeşitli bilgileri (finansal, tıbbi veya eğitim kayıtları gibi belirli veri türleri) bilginiz olmadan kullanmasına izin vererek mevcut birçok yasayı atlayabilir. Bazı şirketler, verileri kullanarak, potansiyel müşterilerin kredi değerliliğini tipik bir kredi puanının ötesinde belirleyebilir; bu, buldukları şeye ve nasıl yorumladıklarına bağlı olarak sizin için iyi veya kötü olabilir. Ancak bir başka endişe de bu tür kişisel bilgilerin tespit edilmesinin ayrımcılığa yol açabileceğidir. Daha da kötüsü, her zaman tamamen doğru olmayabilir.

Büyük veride görülen ve ortaya çıkan örüntüler de yanlış yorumlanarak kötü kararlara yol açabilmektedir. Herhangi bir araç kullanımında olduğu gibi, sonuçlar onu ne kadar iyi kullandığınıza bağlıdır. İşin içinde matematik olsa da, büyük veri analitiği kesin bir bilim değildir ve insan planlama ve karar verme bir şekilde devreye girmelidir. Büyük veri kümelerinde, neyin önemli olduğu ve neyin dışarıda bırakıldığı hakkında kararlar alınmalıdır. Ancak, büyük veri analizi yapmak şirketlere rekabet avantajı sağlayabilir.

Bu tür analizler, dolandırıcılıkla mücadele gibi açıkça iyi olan şeyler için de kullanılabilir. Bankalar, kredi kartı sağlayıcıları ve diğer para işleme şirketlerinin artık suç faaliyetini gösteren olağandışı kalıpları belirlemek için büyük veri analitiği kullandığı biliniyor. Alışılmadık öğelerin satın alınması, bir müşterinin normalde harcamayacağı tutarlar, tuhaf bir coğrafi bölge veya küçük bir satın alma testinin ardından çok büyük bir satın alma gibi olağandışı durumlar tek bir hesapta tespit edildiğinde ilgili müşteriler hızla uyarılır. Aynı bölgedeki farklı kartlardaki benzer ücretler gibi birden çok hesaptaki modeller, bir şirketteki olası dolandırıcılık davranışlarının tespit edilmesini de mümkün kılabilir.

Büyük veri kümeleri, bilimsel ve sosyal araştırmalara, seçim tahminlerine, hava tahminlerine ve diğer faydalı çalışmalara yardımcı olabilir. Hastalık salgınlarını hızlı bir şekilde bulmak için sosyal medya mesajları ve Google aramaları kullanılır. Kolluk kuvvetlerinin tüm olası sorunları çözmesi ve bizi olası zararlardan koruması zaman alacaktır. O zaman bile endişelendiysen, nakit alımlara geri dönebilir ve kendin için ne yaptığını görebilirsin. Ancak günümüzde yaşadığımız dijital çağda dijital dünyadan tamamen uzaklaşmak mümkün değil.

Her şey gibi, büyük veri de iyi ya da kötü birçok farklı amaç için kullanılabilir. Bizi hedefleyen reklamlara ve kuponlara sahip olmak büyük bir rahatsızlık olduğu kadar bir rahatlama da sağlayabilir. Bu sebeplerden dolayı dijital işlemlerinizi sadece güvendiğiniz işletmelerde yapmanız, kaynağını bilmediğiniz uygulamaları indirip kullanmamanız tavsiye edilmektedir. Güveniyor olsanız bile kötüye kullanım amaçlı uygulamalardan kaçınmanız ve kesinlikle gerekli olmadıkça kullanmamanız kişisel verilerinizin güvenliği açısından önemlidir.

Kaynak:
https://computer.howstuffworks.com/internet/basics/what-is-big-data-.htm

yazar: Bekir Afşar

Diğer gönderilerimize göz at

[wpcin-random-posts]

Yorum yapın