توضیحات
ما به دنبال یک مهندس داده با تجربه و درک عمیق از سیستمهای دریاچههای داده، انبارهای داده و پایگاه داده هستیم. در این نقش شما مسئول طراحی، توسعه و بهینهسازی زیرساختهای داده در مقیاس بزرگ خواهید بود تا یکپارچگی بینقص، دسترسی بالا و مقیاسپذیری را تضمین کنید. کاندید ایدهال باید در روشهای مدیریت داده تخصص قوی داشته باشد و بتواند راهحلهای پیشرفتهای را برای پشتیبانی از جریانهای کاری تحلیلی پیچیده و نیازهای بلادرنگ (real-time) پیادهسازی کند. همچنین شما با تیمهای هوش مصنوعی همکاری نزدیک خواهید داشت تا مدلها و راهحلهای هوشمندی ایجاد کنید که از دادههای ما به طور موثر بهرهبرداری کنند.
مسئولیتهای کلیدی:
- توسعه خطوط لوله داده: طراحی، توسعه و نگهداری خطوط لوله ETL/ELT مقیاسپذیر برای استخراج، تبدیل و بارگذاری کارآمد دادهها در سیستمهای متنوع. اطمینان از سازگاری، قابلیت اطمینان و قابلیت حسابرسی دادهها.
- مدیریت دریاچه و انبار داده: رهبری در طراحی، بهینهسازی و نگهداری دریاچهها و انبارهای داده برای سازماندهی و بازیابی کارآمد دادهها، تسهیل تصمیمگیری مبتنی بر داده.
- مدیریت پایگاه داده: مدیریت و بهینهسازی پایگاههای داده رابطهای و NoSQL برای تضمین عملکرد بالا، یکپارچگی داده و امنیت. استفاده از تکنیکهایی مانند ایندکسگذاری، شاردینگ و تکرار.
- یکپارچهسازی و تجمیع داده: توسعه جریانهای کاری برای یکپارچهسازی و تجمیع دادهها از منابع متعدد، ایجاد مجموعه دادههای غنی شده مناسب برای تحلیل و گزارشدهی.
- بهینهسازی عملکرد: نظارت و بهبود مستمر عملکرد دریاچههای داده، انبارهای داده و خطوط لوله مرتبط برای مدیریت ورودی و تبدیل دادههای بزرگ مقیاس.
- تضمین کیفیت داده: با پیادهسازی و اعمال استانداردهای کیفیت داده، شامل اعتبارسنجی خودکار، تشخیص ناهنجاری و فرآیندهای تطبیق، دقت و قابلیت اطمینان دادهها را تضمین نمایید.
- روحیه کار تیمی: با همکاری نزدیک با دانشمندان داده، تحلیل گران کسبوکار و مهندسان هوش مصنوعی، اطمینان حاصل کنید که زیرساخت داده از تحلیلها، یادگیری ماشین و اهداف کسبوکار پشتیبانی میکند؛ این همکاری امکان توسعه بینقص مدلهای هوش مصنوعی را فراهم میآورد.
- پشتیبانی زیرساخت: با تیم DevOps همگام شوید تا استقرار زیرساختهای داده ابری را سازماندهی کنید، از ابزارهای زیرساخت به عنوان کد بهره ببرید و مقیاسپذیری، تحمل خطا و بازیابی از فاجعه را تضمین نمایید.
شرایط احراز:
- مهارتهای ارتباطی: تسلط قوی در ارتباط نوشتاری و گفتاری انگلیسی برای بیان موثر مفاهیم فنی به ذینفعان فنی و غیر فنی.
- تجربه: حداقل سه سال تجربه حرفهای در مهندسی داده، با تخصص عملی در مدیریت دریاچههای داده پیچیده، انبارهای داده و پایگاههای داده توزیع شده.
- دریاچههای داده: تجربه اثبات شده در طراحی و پیادهسازی معماریهای دریاچه داده با استفاده از ابزارهایی مانند Amazon S3 ،Azure Data Lake یا Google Cloud Storage.
- انبار داده: تخصص در پلتفرمهایی مانند Amazon Redshift ،Snowflake یا Google BigQuery، با تمرکز بر طراحی پیشرفته اسکیما و بهینهسازی کوئری.
- مدیریت پایگاه داده: تسلط قوی به SQL، با تجربه در مدیریت پایگاههای داده رابطهای (مانند PostgreSQL و MySQL) و سیستمهای NoSQL (مانند MongoDB و Cassandra).
- توسعه ETL: مهارت در ابزارهای ETL مانند Apache Airflow ،Talend یا Informatica برای خودکارسازی جریانهای کاری داده.
- برنامهنویسی: مهارتهای قوی در Python، با تاکید بر نوشتن کد تمیز، ماژولار و مستند.
- پردازش دادههای بزرگ: دانش عمیق از فریمورکهای داده بزرگ مانند Apache Spark ،Hadoop یا Kafka برای پردازش دادههای توزیعشده و جریانی.
- پلتفرمهای ابری: تجربه عملی با پلتفرمهای ابری مانند AWS ،Google Cloud یا Azure شامل استفاده از ابزارها و خدمات ابری.
- جریان بلادرنگ: تجربه با پلتفرمهای جریان داده بلادرنگ مانند Apache Kafka یا Amazon Kinesis برای نگهداری خطوط لوله بلادرنگ.
مهارتهای ترجیحی:
- کانتینرسازی و ارکستراسیون: تجربه با Docker و Kubernetes برای کانتینرسازی و مدیریت بارهای کاری توزیع شده.
- تصویریسازی داده: آشنایی با ابزارهایی مانند Power BI یا Tableau برای پشتیبانی از بینشهای کسبوکار و گزارشدهی.