Hoşgeldin Sivil

.
Forum Yöneticisi: Administrator | Bu Bölümde Yetkili Tüm Yöneticiler? | Bu konuyu okuyanlar?

 Forum Ana Sayfa
   Cyber Security

   
 Kurallar    Aktif Konular    PM    Kayıt Ol     Giriş Yap  
» Amazon CloudWatch ile Databricks İzleme
 Konu Kalitesi %12.5
Oy Ver   
 
Gönderilme Tarihi: 03 Haziran 2022 09:03:35 - Kayıtlı IP
  Mesajı İhbar Et!     

s27anonym
0x27 | Akıncı

Yüzbaşı

İstanbul
20 Mart 2022
27 Mesaj

Durum: Urfalıyam


Aktiflik
Seviye
Deneyim



  • Amazon CloudWatch ile Databricks Nasıl İzlenir?


  • Mühendislerin çevreleri için neden bir izleme/uyarı sistemi kurmaları gerektiğinin temel nedenlerinin, faydalarının ve ayrıca sağlam bir izleme sisteminin merkezi bileşenlerinin gözden geçirilmesi ile başlayacağım.


  • Ayrıca Amazon CloudWatch'in de aralarında bulunduğu Databricks üzerinde bir izleme ve uyarı sistemi oluşturmanın farklı yollarını inceleyeceğiz. Son bölümde, CloudWatch'i seçmenin nedenlerini/faydalarını ve mühendislerin CloudWatch'i ile Databricks üzerinde bir izleme sistemi oluşturmak için izlemesi gereken belirli adımları açıklamaya çalışacağım.


  • Databricks Lakehouse Platformu, veri göllerinin ve veri ambarlarının en iyi unsurlarını bir araya getirerek, veri göllerinin sunduğu düşük maliyetli, esnek nesne depolarıyla tipik olarak veri ambarlarında bulunan veri yönetimi ve performansını sunar. Binlerce müşteri, sürekli veri ardışık düzenlerini çalıştırmak için AWS'de Databricks kullanıyor. Ayrıca, iş izleme, bu boru hatlarını çalıştırmak için kritik bir görev öğesidir.


  • Neden izleme ve uyarı?


  • Sağlam bir izleme ve uyarı sistemi, DevOps ve mühendislik ekiplerinin sağlıklı ve istikrarlı bir üretim ortamının korunmasına yardımcı olmak için aşağıdaki soruları proaktif olarak yanıtlanması gerekmektedir :


    1) Sağlık kontrolü : Yaptığınız işler ve temel/altın sinyalleriniz sağlıklı mı?

    2) Gerçek zamanlı uyarı : Bir şey mi bozuldu yoksa kırılmak üzere mi?

    3) Ad hoc retrospektif analiz : “Dün gece işimiz gerçekten yavaştı; aynı anda ne oldu?”

    4) Deney yapılandırmaları : “Geçen hafta işlerim daha mı yavaş çalışıyordu? Performansı artırmak için daha fazla CPU veya bellek eklemeli miyiz?”



  • Databricks izleme ve uyarı sistemindeki temel bileşenler


  • 1) Metrikler: Metrikler, belirli bir süre boyunca ölçülen faaliyeti veya belirli bir süreci tanımlayan sayılardır. Databricks'te farklı metrik türleri şunlardır:

    & CPU, bellek, disk ve ağ gibi sistem kaynağı düzeyindeki ölçümler.

    & Özel Metrik Kaynağını kullanan Uygulama Metrikleri StreamingQueryListener, ve QueryExecutionListener.

    & Kıvılcım Metrikleri tarafından açığa çıkarıldı MetricsSystem.



  • 2) Günlükler : Günlükler, meydana gelen seri olayların bir temsilidir ve onlar hakkında doğrusal bir hikaye anlatırlar. Databricks'te farklı günlük türleri şunlardır:


    & Olay günlükleri

    & Denetim günlükleri

    & Sürücü günlükleri: stdout, stderr, log4j özel günlükleri (yapılandırılmış günlük kaydını etkinleştir)

    & Yürütücü günlükleri: stdout, stderr, log4j özel günlükleri (yapılandırılmış günlük kaydını etkinleştir)


  • 3) İzler : Yığın izleri uçtan uca görünürlük sağlar ve aşamalar arasındaki tüm akışı gösterir. Bu, hangi aşamaların/kodların hatalara/performans sorunlarına neden olduğunu belirlemek için hata ayıklamanız gerektiğinde kullanışlıdır.

  • 4) Gösterge Tabloları : Gösterge tabloları, bir uygulamanın/hizmetin altın metriklerinin harika bir özet görünümünü sağlar.


    5) Uyarılar : Uyarılar, mühendisleri dikkat gerektiren durumlar hakkında bilgilendirir.


  • Neden Amazon CloudWatch?


  • Ganglia UI ve Log Delivery gibi yerel çözümler, sistem ölçümlerini toplamak ve Apache Spark™ ölçümlerini sorgulamak için harika çözümlerdir. Ancak, bazı alanlar geliştirilebilir:

    & Ganglia, uyarıları desteklemez.

    & Ganglia, günlüklerden türetilen ölçümler oluşturmayı desteklemez (ör. HATA günlüğü büyüme oranı).

    & Veri doğruluğu, veri tazeliği veya uçtan uca gecikme ile ilgili SLO'yu (Hizmet Düzeyi Hedefleri) ve SLI'yi (Hizmet Düzeyi Göstergeleri) izlemek ve ardından bunları gangliyonla görselleştirmek için özel panoları kullanamazsınız.


    Databricks'i CloudWatch ile entegre etmek ve yapılandırılmış günlük kaydını etkinleştirmek bu alanların iyileştirilmesine yardımcı olabilir. CloudWatch Application Insights, günlüklerde bulunan alanlar otomatik olarak keşfetmemize yardımcı olabilir ve CloudWatch Logs Insights, daha hızlı hata ayıklama ve analiz için amaca yönelik oluşturulmuş bir sorgu dili sağlar.




  • Amazon CloudWatch ile Databricks nasıl entegre edilir


  • Aşama 1:

    Aşağıdaki izinlerle IAM rolü oluşturalım:


    & CloudWatchAgent Sunucu Politikası

    & ec2:DescribeTags – init betiğindeki küme adını ec2 örnek etiketlerinden almamız gerektiği için






  • Adım 2:



    & Spark Config altında, metrics.namespace öğesini, uygulama kimliğinin metriklerin önüne eklenmeyeceği şekilde ayarlayalım


.

  • Aşama 3:


    & Aşağıdaki komutu çalıştırarak aracının çalıştığını doğrulayalım:

    >> %sh ps -ef |grep cloudwatch | grep agent

    & Yukarıdaki komutun çıktısı, çalışan PID'yi gösterecektir.











  • & Örnek Pano ve yapılandırma aşağıdaki gibidir:





  • Güvenilir Veri İşlem Hatları ve Veri Bilimi İşleri


  • Yerinde izleme ve uyarı ile veri boru hatlarımızdaki sorunların önüne geçebiliriz. Yavaş işleri ve başarısız işleri tespit ederek, bunlara neden olan sorunları tüm kuruluşumuzu etkilemeden önce çözebiliriz. İster hatalı kodun belirlenmesi, ister daha büyük veri kümelerinin tanınması veya bölgesel kesintilerin bulunması olsun, izleme ve uyarı, veri boru hatlarımızın akışını sürdürmek için bu sorunları tam olarak belirlememize yarar.




___________________________________________
Cyber-Warrior TIM
          
  Lojistik Destek ,    
 
 
Gönderilme Tarihi: 03 Haziran 2022 12:36:18 - Kayıtlı IP
  Mesajı İhbar Et!     

EmreZeriX

Albay

/public_html
14 Aralık 2021
104 Mesaj

Durum: Yorgun


Aktiflik
Seviye
Deneyim
Moderatör

Görev Org./Grup :

Sosyal Medya


Lojistik

Uzmanlık Alanları:
BD Script
AI Researcher

Ellerine sağlık Amazon serisi harika gidiyor.


___________________________________________

          
     
 
 
Gönderilme Tarihi: 03 Haziran 2022 18:17:31 - Kayıtlı IP
  Mesajı İhbar Et!     

Dağıztanlı08

Albay

İstanbul
23 Şubat 2022
51 Mesaj

Durum: Complicated


Aktiflik
Seviye
Deneyim
Moderatör

Görev Org./Grup :

Lojistik


Eline sağlık gayet açıklayıcı olmuş. Devamını bekliyoruz.

       
     
 
 
Gönderilme Tarihi: 03 Haziran 2022 21:03:29 - Kayıtlı IP
  Mesajı İhbar Et!     

HAYALET

Albay

03 Ocak 2022
254 Mesaj

Durum: Beyaz Ve Sen


Aktiflik
Seviye
Deneyim
Moderatör

Görev Org./Grup :

Sosyal Medya


Lojistik


eline saağlık


___________________________________________
Oraleti sevmemiz portakala olan düşkünlüğümüzden değil biz ezilenin yanındayız.
       
     
 
 
Git:
  Arkadaşına yolla

Sayfa Yüklenme Süresi: 1.7838


 

İçerik Yöneticisi : AKTIF / Veriler Aktarıldı...
IP Adresiniz : 172.70.130.89 Güvenlik Nedeniyle Kayıt Altındadır.



Uzun yoldan geldik, uzun yola devam...

   


Reklam vermek için tıklayın

Forum Kuralları | Üye Olmak İçin | CyberAkademi | Operasyonel TİM'ler
CYBERAKADEMI ~ 2021