توضیحات

ما به دنبال یک مهندس داده با تجربه و درک عمیق از سیستم‌های دریاچه‌های داده، انبارهای داده و پایگاه داده هستیم. در این نقش شما مسئول طراحی، توسعه و بهینه‌سازی زیرساخت‌های داده در مقیاس بزرگ خواهید بود تا یکپارچگی بی‌نقص، دسترسی بالا و مقیاس‌پذیری را تضمین کنید. کاندید ایده‌ال باید در روش‌های مدیریت داده تخصص قوی داشته باشد و بتواند راه‌حل‌های پیشرفته‌ای را برای پشتیبانی از جریان‌های کاری تحلیلی پیچیده و نیازهای بلادرنگ (real-time) پیاده‌سازی کند. همچنین شما با تیم‌های هوش مصنوعی همکاری نزدیک خواهید داشت تا مدل‌ها و راه‌حل‌های هوشمندی ایجاد کنید که از داده‌های ما به طور موثر بهره‌برداری کنند.

مسئولیت‌های کلیدی:

  • توسعه خطوط لوله داده: طراحی، توسعه و نگهداری خطوط لوله ETL/ELT مقیاس‌پذیر برای استخراج، تبدیل و بارگذاری کارآمد داده‌ها در سیستم‌های متنوع. اطمینان از سازگاری، قابلیت اطمینان و قابلیت حسابرسی داده‌ها.
  • مدیریت دریاچه و انبار داده: رهبری در طراحی، بهینه‌سازی و نگهداری دریاچه‌ها و انبارهای داده برای سازمان‌دهی و بازیابی کارآمد داده‌ها، تسهیل تصمیم‌گیری مبتنی بر داده.
  • مدیریت پایگاه داده: مدیریت و بهینه‌سازی پایگاه‌های داده رابطه‌ای و NoSQL برای تضمین عملکرد بالا، یکپارچگی داده و امنیت. استفاده از تکنیک‌هایی مانند ایندکس‌گذاری، شاردینگ و تکرار.
  • یکپارچه‌سازی و تجمیع داده: توسعه جریان‌های کاری برای یکپارچه‌سازی و تجمیع داده‌ها از منابع متعدد، ایجاد مجموعه داده‌های غنی شده مناسب برای تحلیل و گزارش‌دهی.
  • بهینه‌سازی عملکرد: نظارت و بهبود مستمر عملکرد دریاچه‌های داده، انبارهای داده و خطوط لوله مرتبط برای مدیریت ورودی و تبدیل داده‌های بزرگ مقیاس.
  • تضمین کیفیت داده: با پیاده‌سازی و اعمال استانداردهای کیفیت داده، شامل اعتبارسنجی خودکار، تشخیص ناهنجاری و فرآیندهای تطبیق، دقت و قابلیت اطمینان داده‌ها را تضمین نمایید.
  • روحیه کار تیمی: با همکاری نزدیک با دانشمندان داده، تحلیل گران کسب‌وکار و مهندسان هوش مصنوعی، اطمینان حاصل کنید که زیرساخت داده از تحلیل‌ها، یادگیری ماشین و اهداف کسب‌وکار پشتیبانی می‌کند؛ این همکاری امکان توسعه بی‌نقص مدل‌های هوش مصنوعی را فراهم می‌آورد.
  • پشتیبانی زیرساخت: با تیم DevOps همگام شوید تا استقرار زیرساخت‌های داده ابری را سازمان‌دهی کنید، از ابزارهای زیرساخت به عنوان کد بهره ببرید و مقیاس‌پذیری، تحمل خطا و بازیابی از فاجعه را تضمین نمایید.

شرایط احراز:

  • مهارت‌های ارتباطی: تسلط قوی در ارتباط نوشتاری و گفتاری انگلیسی برای بیان موثر مفاهیم فنی به ذینفعان فنی و غیر فنی.
  • تجربه: حداقل سه سال تجربه حرفه‌ای در مهندسی داده، با تخصص عملی در مدیریت دریاچه‌های داده پیچیده، انبارهای داده و پایگاه‌های داده توزیع شده.
  • دریاچه‌های داده: تجربه اثبات شده در طراحی و پیاده‌سازی معماری‌های دریاچه داده با استفاده از ابزارهایی مانند Amazon S3 ،Azure Data Lake یا Google Cloud Storage.
  • انبار داده: تخصص در پلتفرم‌هایی مانند Amazon Redshift ،Snowflake یا Google BigQuery، با تمرکز بر طراحی پیشرفته اسکیما و بهینه‌سازی کوئری.
  • مدیریت پایگاه داده: تسلط قوی به SQL، با تجربه در مدیریت پایگاه‌های داده رابطه‌ای (مانند PostgreSQL و MySQL) و سیستم‌های NoSQL (مانند MongoDB و Cassandra).
  • توسعه ETL: مهارت در ابزارهای ETL مانند Apache Airflow ،Talend یا Informatica برای خودکارسازی جریان‌های کاری داده.
  • برنامه‌نویسی: مهارت‌های قوی در Python، با تاکید بر نوشتن کد تمیز، ماژولار و مستند.
  • پردازش داده‌های بزرگ: دانش عمیق از فریم‌ورک‌های داده بزرگ مانند Apache Spark ،Hadoop یا Kafka برای پردازش داده‌های توزیع‌شده و جریانی.
  • پلتفرم‌های ابری: تجربه عملی با پلتفرم‌های ابری مانند AWS ،Google Cloud یا Azure شامل استفاده از ابزارها و خدمات ابری.
  • جریان بلادرنگ: تجربه با پلتفرم‌های جریان داده بلادرنگ مانند Apache Kafka یا Amazon Kinesis برای نگهداری خطوط لوله بلادرنگ.

مهارت‌های ترجیحی:

  • کانتینرسازی و ارکستراسیون: تجربه با Docker و Kubernetes برای کانتینرسازی و مدیریت بارهای کاری توزیع شده.
  • تصویری‌سازی داده: آشنایی با ابزارهایی مانند Power BI یا Tableau برای پشتیبانی از بینش‌های کسب‌وکار و گزارش‌دهی.

برای مشاهده‌ی شغل‌هایی که ارتباط بیشتری با حرفه‌ی شما دارد،

محاسبه‌کننده حقوق

چقدر حقوق بگیرم؟