feature-engineering.png

مدل نیاز به الگوریتم ها و داده ها و وقتی که می آید به اطلاعات ماشین, آموزش مدل های به خصوص گرسنه اشتهای. در عین حال وقتی که می آید به تبدیل داده ها را به ویژگی های مصرف شده توسط مدل با داده های دانشمندان اغلب به اختراع دوباره چرخ به عنوان ویژگی نسل فاقد پیکربندی مدیریت و اتوماسیون فرآیندهای مرتبط با مدل گردش.

Tecton راه اندازی است که به تازگی پدید آمده از خفا معرفی یک سرویس مبتنی بر ابر در نظر گرفته شده برای خروج از این بحران. آنها در حال تلاش برای از ویژگی های نسل, معرفی, از همان نوع نگهداری و استفاده مجدد است که Informatica بود که آن را معرفی خودکار داده ها تحولات به داده های انبارداری جهان در تاسیس آن.

این cofounders شرکت آمد از بارگذاری جایی که آنها مسئول پروژه میکل آنژ شرکت ماشین آلات پلت فرم یادگیری.

در حال بارگذاری میکل آنژ در زمان مراقبت از کامل چرخه میلی لیتر از مدیریت داده ها برای آموزش و ارزیابی و استقرار مدل به دنبال ساخت و نظارت بر پیش بینی است. در میان درس های آموخته شده از توسعه میکل آنژ پلت فرم بود که از ویژگی های نسل فاقد درجه دقیق چرخه اتوماسیون است که مدل توسعه است. همه بیش از حد اغلب دانشمندان داده بود و به حفظ و بازسازی چرخ در هنگام ایجاد امکانات و آغاز که اتوماسیون ساخته شد به پلت فرم.

اینها درس است که بنیانگذاران شرکت را به ایجاد Tecton. این آدرس بخشی از مشکل تأثیر داده های دانشمندان: آنها اغلب هزینه های بیش از حد از زمان خود را انجام داده و مهندسی است. چند سال پیش در یک نظرسنجی که به طور مشترک اسپانسر شده از طرف تخمک (در حال حاضر Omdia) و Dataiku ما در بر داشت که حتی در بهترین شرایط به دانشمندان داده خواهد شد هنوز هم به احتمال زیاد به صرف نیمی از وقت خود را با داده ها.

در یک شرکت, وبلاگ Tecton میسازد مشکل در جامع جزئیات. بسیاری از ابر AutoML خدمات می تواند به طور خودکار جنبه های توسعه الگوریتم و ویژگی های انتخاب همراه با گردش کار از حرکت مدل از آموزش به کارگیری و تولید, اما آنها فاقد هر گونه اتوماسیون با ویژگی های مهندسی است که تغذیه مدل با داده ها.

Tecton امر همان DevOps اتوماسیون به ویژگی های توسعه است که هنجار برای برنامه نویسی منطق ، تمام آثار مربوط به ساختمان از ویژگی های (به عنوان مثال داده های منابع تحولات و دستور العمل برای پردازش) ذخیره می شود و دارای ورژن در یک مخزن دستگاه گوارش فقط به عنوان مدل سازی منطق است.

نتیجه این است که legwork درگیر با ایجاد و استقرار داده در خطوط لوله مورد استفاده برای تولید ویژگی های خودکار است. این به این معنا نیست که اطلاعات دانشمندان دیگر نیاز به اطلاعات مهندسین, اما آنها می تواند تبدیل به وابستگی کمتر بر روی آنها. اطلاعات مهندسین هنوز هم مورد نیاز در ابتدا از ساختمان یک ویژگی برای اتصال به منابع داده. اما پس از آن اجازه می دهد تا داده ها دانشمندان به کار در پایتون نوت بوک برای طراحی از ویژگی های تحول منطق است. گام بعدی این است که مشخص کردن اطلاعات پیکربندی (به عنوان مثال مشخص کردن داده های منابع فراوانی از تحولات و اینکه آیا برای خدمت به ویژگی های آنلاین و یا آفلاین در دسته ای). همه این آثار ذخیره شده در مخزن دستگاه گوارش که می توان آنها را دارای ورژن مشترک و مورد استفاده مجدد قرار.

این مفهوم قابل علاج و درمان است که اطلاعات دانشمندان نباید فرو رفته در کسب و کار طراحی و استقرار و داده های در حال اجرا خطوط لوله و آنها نباید نیاز به زحمت داده مهندسین در هر زمان آنها را به طراحی ویژگی های جدید و یا اجرای کار دیگری. هنگامی که از ویژگی های توسعه یافته Tecton خودکار بهره برداری از خط لوله تحریک اجرای مناسب موتور مانند جرقه به صورت دسته ای و یا Flink یا کافکا جریان برای جریان. این آدرس یک قسمت از مدل استقرار تنگنا به دانشمندان داده لازم نیست که به نگرانی در مورد سیم کشی تا اجرای درست موتورهای.

برای پیگیری چرخه و پشتیبانی از قابلیت استفاده مجدد, Tecton حفظ اطلاعات و نسب داده و باعث می شود ابرداده, جستجو, در یک “ویژگی های فروشگاه فروشگاه. همان خطوط لوله می تواند مورد استفاده هر دو برای آموزش و تولید زنده دیتا و نسخه گذاری این خط لوله از آنها را می توان به آسانی تکرار داده ها توسط دانشمندان در سلف سرویس های پایه ای برای اصلاح و یا ایجاد امکانات جدید.

داشتن پدید آمده از خفا در گذشته زن و شوهر ماه Tecton ارائه شده است در حال حاضر در حال اجرا در خصوصی نمایش در AWS. همانطور که در بالا اشاره شد آن را مدیریت و خودکار ویژگی های خطوط لوله و شامل ویژگی های فروشگاه برای ذخیره سازی تاریخی از ویژگی های و برچسب داده ها; شامل یک SDK برای بازیابی داده های آموزشی; به علاوه یک وب سایت بر اساس رابط کاربر برای ویژگی های ردیابی و نظارت بر کیفیت داده ها و اطلاعات رانش مسائل. هنگامی که AWS ارائه بازدید کلی انتشار Tecton به دنبال خواهد داشت با ابرهای دیگر بعد از آن. به ما این را یک مکمل مفید برای ابر AutoML خدمات کمک به آنها را به طور خودکار از دست رفته مایل از داده ها.

هوش مصنوعی

tinyurlis.gdv.gdv.htclck.ruulvis.netshrtco.detny.im