روزنوشته های فربد صالحی

درباره زندگی و برنامه نویسی

دوره‌ی مقدماتی data science - مقدمه‌ای بر یادگیری ماشین

این پنجمین و آخرین بخش از خلاصه‌ی مجموعه‌ی «دوره‌ی مقدماتی data science» هستش. 

بخش اول - مقدمه

بخش دوم - مقدمه‌ای بر داده‌ها

بخش سوم - تصویرسازی از داده‌ها و تحلیل آنها

بخش چهارم - مقدمه‌ای بر آمار

 

منظور از یادگیری ماشین چیست؟

ما با استفاده از تعدادی داده‌‌ی در دسترس به یه مدل کامپیوتری یاد می‌دیم که چطور بتونه با دریافت داده‌های ورودی‌ جدید، خروجی مناسب رو پیش‌بینی کنه. در واقع مدل از موردهای آموزشی ارائه شده بهش یاد می‌گیره و بعد از اون ما می‌تونیم از مدلِ آموزش دیده برای پیش‌بینی داده‌های جدید استفاده کنیم. 

 

برای موفقیت در درک این موضوع، نکته‌ی کلیدی توجه به این مساله است که اگه کامپیوترها فقط در یه کار قوی باشن، اون کار اجرای محاسباته. به همین دلیل هستش که کامپیوترهای اولیه به عنوان «موتور محاسبه» شناخته می‌شدن. برای اینکه یه کامپیوتر دارای هوش پیش‌بینی از روی داده‌های موجود باشه، ما نیاز به راهی داریم که روش درست محاسبه رو به اون کامپیوتر یاد بدیم.

 در حالت خیلی کلی،‌ یادگیری ماشین به دو دسته‌ی «با نظارت» و «بدون نظارت» تقسیم می‌شه. در یادگیری با نظارت ما به منظور آموزش، تعدادی جفت ورودی-خروجیِ داده به سیستم ارائه می‌دیم تا با استفاده از اونها یاد بگیره که برای ورودی جدید، چه خروجی باید تولید کنه. اما در یادگیری بدون نظارت، داده‌های ورودی به سیستم به خروجی مشخصی متناظر یا اصطلاحا برچسب‌گذاری نشدن و اصولا هدف هم در اینجا اینه که سیستم بتونه الگوهای پنهان رو در داده‌های ورودی تشخیص بده و اونها رو به صورت درستی دسته‌بندی کنه. 

فرض می‌کنیم می‌خوایم از داده‌هایی که در مورد دمای هوا، میزان بارندگی و تعداد آگهی‌های پخش شده در روزهای مختلف داریم استفاده کنیم و با استفاده از تعداد فروش لیموناد در اون روزها و یادگیری ماشین، تعداد فروش رو در یه روز خاص پیش‌بینی کنیم. 

همونطور که در تصویر بالا می‌بینیم، مجموعه‌ داده‌ی [27.0,0.2,17] به عدد 12 برچسب‌گذاری شده. مشخصه که فقط با استفاده از داده‌ی یک روز نمی‌شه فرایند تعمیم دادن رو بخوبی انجام داد. بنابراین از داده‌های تعداد روزهای بیشتری برای آموزش دادنِ مدل استفاده می‌کنیم. 

 بعد از اینکه به مدل آموزش دادیم، می‌تونیم یه تابع تعمیم داشته باشیم و از اون برای محاسبه‌ی برچسب (Y) بر اساس داده‌های ورودی ([X1, X2, X3]) استفاده کنیم. 

نوع دیگه‌ای از یادگیری با نظارت، «طبقه‌بندی» نامیده میشه. ساده‌ترین نوع طبقه‌بندی از نوع «دوتایی» یا باینری هستش که در اون، مدل باید پیش‌بینی کنه که یه ورودی به کدوم طبقه تعلق خواهد داشت. معمولا یکی از طبقه‌ها به عنوان صحیح (true) و دیگری به عنوان غلط (false) در نظر گرفته میشه. به عنوان مثال در داده‌های مربوط به فروش لیموناد، ما ثبت کرده‌ایم که در کدام روزها سود کرده‌ایم و در کدام روزها سود نکرده‌ایم و اطلاعات مربوط به دمای هوا، میزان بارندگی و تعداد آگهی‌ها رو هم در اختیار داریم. 

همونطور که در تصویر بالا مشخصه،‌ در این نوع یادگیری هم با ارائه‌ی داده‌های موجود به مدل و آموزش مدل، به یه تابع تعمیم می‌رسیم که خروجی اون 0 یا 1 و در واقع غلط یا درست خواهد بود. 

نکته‌ای که در اینجا می‌تونیم بهش اشاره کنیم اینه که خروجی این تابع می‌تونه حتی مقداری بین صفر و یک باشه و ما یه مقدار آستانه، مثلا 0.5 یا 0.25 داشته باشیم که فقط مقدار بیشتر از این مقدار آستانه به عنوان درست در نظر گرفته بشه و بنا به نیازهای مختلف، این مقدار تغییر کنه. 

 

۰ نظر
فربد صالحی

کتاب Running Lean: سنجش ساختارمند طرح - آمادگی برای مصاحبه با مشتریان

این پُست هفتمین بخش از مجموعه‌ی خلاصه‌ی کتاب Running Lean یا اجرای ناب هستش.

بخش اول: مقدمه

بخش دوم: نقشه‌ی راه - اصول فراگیر

بخش سوم: نقشه‌ی راه - یک مثال

 بخش چهارم: مستند کردن طرح - بوم ناب

بخش پنجم: شناخت بخش‌های پر ریسک طرح - اولویت بندی و انتخاب نقطه‌ی شروع

بخش ششم: شناخت بخش‌های پر ریسک طرح - برای آزمایش آماده شوید

 

سریع‌ترین راه یادگرفتن، صحبت کردن با مشتری‌هاست. از این به بعد، ما از مصاحبه‌ با مشتری‌ها به عنوان یه ابزار یادگیری استفاده می‌کنیم. در این بخش به چند مورد پایه‌ای برای رسیدن به یه مصاحبه‌ی خوب اشاره می‌‌شه. 

لطفا نظرسنجی نکنید

معمولا وقتی از بنیان‌گذارای استارتاپ‌ها خواسته میشه که به منظور یادگیری از مشتری‌ها، کوچک‌ترین کار ممکن رو انجام بدن، اولین گرایش اونها به انجام چندتا نظرسنجی هستش. انجام این کار ممکنه موثرتر از مصاحبه با مشتری‌ها به نظر بیاد، با این حال شروع از این نقطه ممکنه ایده‌ی خوبی نباشه. چون:

- انجام نظرسنجی یعنی می‌دونید چه سوالایی باید بپرسید. اما در این مرحله، تهیه‌ی یه نظرسنجی که تمام سوال‌های لازم رو پوشش بده، اگه غیرممکن نباشه کار سختیه. چون شما هنوز نمی‌دونید که اون سوالا چیا هستن. اما در حین مصاحبه‌ با یه مشتری، شما می‌تونید موارد مبهم‌تون رو بپرسید تا براتون روشن بشه یا نقاطی خارج از درک اولیه‌‌تون رو کشف کنید. مصاحبه با مشتری‌ها با هدف کشف مواردی انجام میشه که نمی‌دونید که اونها رو نمی‌دونید.  

- حتی بدتر، نظرسنجی‌ها بر این اساس تهیه میشن که شما جواب‌های مناسب رو هم می‌دونید. در یه نظرسنجی، نه تنها شما باید سوالای مناسب بپرسید، بلکه باید گزینه‌های مناسبی هم به مشتری ارائه کنید. وقتی تو یه نظرسنجی شرکت می‌کردید، چندبار جواب شما گزینه‌ی «سایر» بوده؟ (یعنی جوابی که شما می‌خواستید بدید بین گزینه‌ها نبوده). بهترین یادگیری‌ها از سئوالات بدون حد و مرز به دست میاد. 

- در حین یه نظرسنجی، شما مشتری رو نمی‌بینید. در حالیکه زبان بدن به اندازه‌ی خود پاسخ‌ها می‌تونه نشان‌دهنده‌ی تناسب مساله/راه‌حل باشه. 

آیا نظرسنجی در همه‌ی موارد مناسبه؟

در حالیکه نظرسنجی برای یادگیری اولیه خوب نیست، می‌تونه کاملا در بررسی مواردی که از مصاحبه با مشتری‌ها یاد گرفتید موثر باشه. 

قبلا در مورد اصلِ اعتبارسنجی دو مرحله‌ای صحبت کردیم: اول کیفی، بعد کمّی. مصاحبه‌ با مشتری یک شکل از اعتبارسنجی کیفی موثر هستش. به محض اینکه به تایید اولیه برای فرضیه‌هاتون رسیدید، می‌تونید از اون چیزایی که یاد گرفتید برای تهیه‌ی یه نظرسنجی استفاده کرده و یافته‌هاتون رو به صورت کمّی هم بسنجید. اینجا دیگه هدف یادگیری نیست، بلکه رسیدن به اهمیت آماریِ نتایج هستش.

اما صحبت با افراد کار سخیه

مردم فکر می‌کنند صحبت با مشتری‌ها برای من کار راحتی بوده، در حالیکه من هم مثل اکثر بنیان‌گذارهای فنی، آدم درون‌گرایی بودم. من سالها از ابزارهایی مثل ایمیل، بحث در گروه‌های اینترنتی و وبلاگ‌ِ محصولات برای پرهیز از صحبت مستقیم با مشتری‌ها استفاده می‌کردم. موقعی که با مشتری‌ها صحبت می‌کردم،‌ مکالمه کاملا بی‌فایده به نظر می‌رسید. 

من می‌دونستم که گوش دادن به مشتری‌ها مهمه، اما نمی‌دونستم روش درستش چیه.

گفتنِ اینکه «برو با یه مشتری صحبت کن» تقریبا همونقدر مفیده که بگی «چیزی تولید کن که مردم می‌خوانش». سوال بزرگ اینه: چی بهشون می‌گی؟

تعدادی از روش‌های مناسب برای غلبه بر این محدودیت‌های ذهنی اولیه: 

- یادگیری رو هدف خودتون قرار بدید، نه ارائه و معرفی. ازونجایی که در حین معرفی، بیشتر شما صحبت می‌کنید، برای مشتری خیلی راحت خواهد بود که وانمود کنه با حرفای شما موافقه، یا می‌تونه بوضوح به شما دروغ بگه. مشکلِ شروع کار با ارائه اونجاست که بر این پیش‌بینی استوار میشه که شما می‌دونید چه محصولی برای مشتری مناسبه. قبل از اینکه بتونید راه‌حل مناسب رو ارائه بدید، باید مساله‌ی مشتری رو بدرستی متوجه بشید. وقتی هدف یادگیریه، جاها عوض میشه. زمینه‌ی صحبت رو شما مشخص می‌کنید، اما بعدش اجازه میدید که بیشتر مشتری صحبت کنه. 

- از مشتری‌ها نپرسید که چی‌میخوان، بررسی کنید که چکار می‌کنن. احتمالش خیلی زیاده که مشتری‌ها در حین مصاحبه به دلایل مختلف حقیقت رو نگن. لازم نیست این موضوع رو به روشون بیارید، بلکه سعی کنید راهی رو پیدا کنید که با فهمیدن کارهایی که انجام میدن، ترجیحا در حین مصاحبه، درستی حرف‌هایی که میزنن رو بسنجید. مثلا وقتی مشتری مساله‌ای رو خیلی مهم معرفی‌ می‌کنه، ازش بپرسید در حال حاضر چطور با این مساله مواجه میشه. اگه هیچ کاری در مقابل این مساله انجام نمیده، احتمالا این مساله اهمیت چندانی نداره. یا مثلا اگه گفتن حاضرن برای محصول شما پول بدن، ببینید حاضرن پیش‌پرداخت بدن. 

- به متن مصاحبه پایبند باشید. در غیر این صورت ممکنه مدت زمان زیادی رو صرف بدست آوردن مقدار زیادی اطلاعات بی استفاده کنید.

- فقط به پذیرندگان اولیه محدود نشوید. شما در دورهای بعدی مصاحبه‌ها فرصت زیادی دارید که مصاحبه‌شونده‌ها رو فیلتر کنید، اما در شروع کار به سراغ بازه‌ی وسیع‌تری از مشتری‌ها برید تا اطلاعات کامل‌تری کسب کنید. 

- مصاحبه‌ی رو در رو را ترجیح دهید. علاوه بر مساله‌ی زبان بدن که قبلا در موردش صحبت کردیم، مصاحبه‌ی رو در رو می‌تونه باعث ایجاد حس نزدیکی بشه و رسیدن به این حس که در ایجاد رابطه با مشتری حیاتی هستش، به صورت مجازی امکان‌پذیر نیست. 

- با افرادی شروع کنید که می‌شناسید. پیدا کردن افرادی برای مصاحبه در ابتدای کار ممکنه چالش‌ برانگیز باشه. با افراد آشنا شروع کنید و بعد از اونها برای پیدا کردن افراد دیگه‌ای برای مصاحبه استفاده کنید. 

- یک همراه داشته باشید. همراه کمک می‌کنه تا در حین مصاحبه چیزی از قلم نیفته. مهم‌تر اینکه باعث می‌شه به هدف یادگیری پایبند باشید.

- یک مکان خنثی انتخاب کنید. برای مصاحبه‌ی اول با مشتری، من جایی مثل کافی‌شاپ رو به خاطر ایجاد یه فضای غیر رسمی به یه دفتر ترجیح می‌دم. دفتر موضوع رو تجاری می‌کنه و حسی مثل ارائه‌ی فروش ایجاد می‌کنه که مناسب نیست. 

- مدت زمان مصاحبه مناسب باشد. مصاحبه‌های من بدون حس عجله و شتاب معمولا ۲۰ تا ۳۰ دقیقه طول می‌کشن. هم مطمئن باشید که زمان مورد نیازتان را دارید و هم به وقت مصاحبه‌شونده احترام بگذارید.

- مشوق ارائه نکنید. برخلاف «آزمایش قابلیت استفاده» که تعیین مشوق برای مشارکت قابل قبوله، هدف شما در اینجا پیدا کردن مشتری‌هایی هستش که حاضرن هزینه پرداخت کنن.

- مکالمه‌ها را ضبط نکنید. من قبلا این کار رو با کسب اجازه طرف مقابل انجام می‌دادم، بعد متوجه شدم که این کار باعث میشه مصاحبه‌شونده راحت نباشه.

- نتایج را بلافاصله بعد از مصاحبه مستند کنید. پیشنهاد من اینه که بعد از مصاحبه ۵ دقیقه وقت بذارید و تا ذهنتون آماده است نتایج رو ثبت کنید.

- خودتون رو برای مصاحبه با ۳۰ تا ۶۰ نفر آماده کنید. این عدد به عنوان به قاعده‌ی کلی و در یه بازه‌ی زمانی ۴ تا ۶ هفته‌ای در نظر گرفته میشه که  روزی ۲ یا ۳ مشتری رو شامل میشه. اما عدد واقعی می‌تونه بر اساس علائمی که شما از مصاحبه‌ها دریافت می‌کنید و همچنین بیزینس مدل شما متفاوت باشه.

- برون‌سپاریِ زمان‌بندیِ مصاحبه رو بررسی کنید. بزرگترین اتلاف وقت در بازه‌ی زمانی مصاحبه‌ها انتظاره. انتظار برای جواب افراد، هماهنگی زمانی و .. با چند تا کار کوچک می‌تونید با موفقیت این کار رو به شخص دیگه‌ای بسپارید. این روشیه که من استفاده می‌کنم:

- متن همه‌ی ایمیل‌هایِ درخواست مصاحبه رو می‌نویسم.

- بعدازظهرهام رو خالی نگه می‌دارم تا زمان‌بندی مصاحبه‌ها راحت باشه. 

- در تبادل ایمیل‌ها، ایمیل من هم اضافه میشه، بنابراین هر جا لازم باشه می‌تونم دخالت کنم.

 

روش‌هایی برای یافتن مصاحبه‌شونده

- با افرادی که ارتباط نزدیکی با آنها دارید شروع کنید. بعضی‌ها نگران این موضوع هستن که نتایج این روش ممکنه دارای جهت‌گیری باشه. اما به نظر من صحبت با هر کسی بهتر از صحبت نکردنه. 

- بخواهید که شما را به دیگران معرفی کنند. این درخواست رو با افراد نزدیک به خودتون و با بیان اینکه چه کسانی جامعه‌ی هدف مشتری‌های شما هستن مطرح کنید. بهتره که یه قالبِ پیام از پیش‌آماده رو هم برای اونها آماده کنید تا در زمانشون صرفه‌جویی بشه.

- از گزینه‌ی محلی بودن خود استفاده کنید. به طور کلی افراد نسبت به ملاقات با کسایی که بهشون حس نزدیکی دارن اشتیاق بیشتری دارن. مثلا اگه با فرد مقابل همشهری هستید، این موضوع رو به نوعی تو درخواست خودتون مطرح کنید.  

- یه لیست ایمیل با استفاده از اینترنت تهیه کنید. اگه اینترنت یکی از کانال‌های دسترسی مشتری‌ها به محصول شماست، یه صفحه‌ی معرفی درست کنید و برای ارتباط با مشتری‌های احتمالی امکان ثبت ایمیل‌ براشون فراهم کنید. 

 

برخی مخالفت‌ها با ایده‌ی مصاحبه با مشتریان و پاسخ به آنها

- مشتری‌ها نمی‌دونن که چی می‌خوان: هدف شما از مصاحبه این نیست که ویژگی‌های محصولتون رو از مشتری‌ها بپرسید، بلکه می‌خواید مساله‌ی اونها رو بشناسید و با یه راه‌حل مناسب حلش کنید. 

- صحبت با ۲۰ نفر از نظر آماری مناسب نیست: هدف یه استارتاپ ارائه‌ی یه چیز جدید و برجسته به دنیاست. بزرگ‌ترین چالش شما در ابتدا اینه که بتونید توجه یه عده رو جلب کنید. 

- من فقط به پارامترهای کمّی (عددی) اعتماد دارم: مشکل این رویکرد این هستش که به احتمال زیاد در ابتدا مراجعه‌ی کافی به محصول وجود نداره. اما مساله‌ی مهم‌تر اینه که پارامترهای عددی فقط می‌تونن به شما بگن بازدیدکننده‌ها چه کاری کردن و چه کاری نکردن، اما نمی‌تونن بگن چرا چنین اتفاقی افتاده. 

من خودم مشتری خودم هستم، بنابراین نیازی به صحبت با کسی ندارم: موافقم که اینکه شما خودتون مساله‌ای رو تجربه کردید یه مزیت هستش،‌ اما این دلیل خوبی برای عدم صحبت با مشتری‌ها نیست. شما همچنان نیاز به بررسی این موضوع دارید که آیا این مساله‌ای هستش که ارزش حل کردن داره یا نه. 

- به نظر دوستانم این ایده عالیه: من در ابتدا با هر کسی حرف می‌زنم، اما نه به منظور یادگیری. چون جواب‌های اونها ممکنه بر اساس برداشت‌های خودشون خیلی مثبت یا خیلی منفی باشه. از دوستانتون برای تمرین انجام مصاحبه و آشنایی با افراد دیگه برای مصاحبه استفاده کنید. 

- چرا چند هفته صرف صحبت با مشتری‌ها کنیم، وقتی میشه تو یه آخر هفته یه چیزی تولید کرد: صرف زمان برای ساختن چیزی حتی بسیار مختصر هم می‌تونه اتلاف وقت باشه. اولا در بیشتر مواقع این تولیدات مختصر، واقعا اونقدرها هم مختصر نیستن. ضمن اینکه برای سنجیدن یه راه‌حل نیاز به اتمام ساخت اون ندارید،‌ بلکه می‌تونید از نمونه‌های فیزیکی اولیه، طراحی‌ها،‌ تصاویر ویدئویی و ... استفاده کنید. سعی کنید به فرایند یادگیری با استفاده از کوچک‌ترین راه‌حل‌های ممکن سرعت بدید.  

- نیازی به سنجش مساله نیست، چون کاملا واضحه: درسته که گاهی به دلایل مختلف وجود مساله کاملا واضح و روشنه، اما باز هم نیاز به درک مساله وجود خواهد داشت. ما می‌خوایم بدونیم که این مساله روی چه مشتری‌هایی بیشترین تاثیر رو داره، مشتری‌ها الان چطور مساله رو حل می‌کنن و شما چه ارزش متفاوتی به اونها پیشنهاد خواهید کرد. 

- نمی‌شه مساله رو سنجید،‌ چون مساله روشن نیست: ممکنه شما قصد دارید محصولی بسازید که به نظرتون هدفش حل یه مساله نیست،  مثلا یه بازی کامپیوتری، یه فیلم کوتاه یا یه رمان تخیلی. اما من می‌گم حتی تو این موردها هم میشه مساله‌ای پیدا کرد،‌ هر چند که در اینجا مساله بیشتر از نوع «خواسته» هستش. در اینجا هم هدف ما از مصاحبه درک بهتر مصرف‌کنندگان محصول و پیدا کردن مختصرترین و سریع‌ترین روش برای سنجیدن راه‌حل‌ خواهد بود. 

- افراد ایده‌ی من رو می‌دزدن: مصاحبه‌های ابتدایی کاملا بر روی مساله متمرکز خواهند بود و شما سعی می‌کنید مساله رو از طریق مشتری‌هایی که می‌دونید قبلا با این مساله مواجه شدن درک کنید. بنابراین فعلا چیزی برای دزدیدن وجود نداره. این وضعیت تا زمان انجام مصاحبه‌های مربوط به راه‌حل که شما راه‌حل خودتون رو بیان می‌کنید ادامه خواهد داشت. در اون زمان هم شما باید پذیرندگان اولیه‌ای رو انتخاب کنید که ترجیح می‌دن پول بدن و محصول شما رو بخرن، نه اینکه خودشون یکی تولید کنن. 

- افراد، خریدار یه طرح خالی نخواهند بود: وقتی شما مشکل مشتری رو درک کنید و بهش کمک کنید که یه راه‌حل قابل دسترس رو تصور کنه، خریدار شما میشه. در صورتیکه مواردی نظیر ارائه‌ی دوره‌ی آزمایشی، امکان لغو راحت و نظیر اون رو هم فراهم کنید. 

 

 

۰ نظر
فربد صالحی

درباره‌ی «شُدن»

 

کتاب «شُدن» (becoming) توسط «میشل اوباما» همسر چهل و چهارمین رئیس‌جمهور آمریکا «باراک اوباما» نوشته شده که در اون به زندگی خودش در قبل و بعد از ازدواج و همچنین در دوران ریاست‌جمهوری همسرش می‌پردازه. این کتاب عنوان پرفروش‌ترین کتاب سال ایالات متحده رو هم کسب کرده. 

امروز خوندن این کتاب رو تموم کردم. نیمه‌ی اول این کتاب درباره‌ی خانواده، کودکی، تحصیل، اشتغال و همچنین نحوه‌ی آشنایی، ازدواج و زندگیِ خصوصیِ نویسنده‌ی کتاب با باراک اوباما و نیمه‌ی دوم کتاب بیشتر درباره‌ی حضور خانواده‌ی اوباما (میشل، باراک و دو دخترشون) در «کاخ سفید» و ویژگی‌های زندگی به عنوان «بانوی اول آمریکا» هستش.  

برای من نیمه‌ی اول کتاب جذابیت بیشتری داشت. تو این بخش میشل اوباما خیلی دقیق و با جزئیات فضای محل زندگی، روحیات و روابط پدر و مادرش با همدیگه، و نحوه‌ی تربیت فرزند توسط اونها رو شرح میده. علاوه بر اینها، توضیح انگیزه‌هاش در تحصیل و کار و همچنین دیدگاهش در انتخاب‌ شغل و همسر نکات جالبی داره. 

 به‌ نظرم با توجه به اینکه میشل اوباما در خانواده‌ای معمولی و حتی شاید ضعیف از نظر مالی به دنیا اومد و رشد کرد، و همچنین جزو اقلیت رنگین‌پوست آمریکا بود که احتمالا در اون سالها به معنی دشواری‌های بیشتری هم بوده، این بخش از کتاب می‌تونه برای همه‌، از جمله نوجوان‌ها و بخصوص دخترای نوجوان مفید و الهام‌بخش باشه. 

در نیمه‌ی دوم کتاب برخلاف انتظار من، خیلی به جزئیات اتفاقات داخل کاخ سفید که مسلما نویسنده ناظر خیلی از اونها بوده پرداخته نشده و به نظرم میشد حتی در نصف حجم فعلی هم این بخش رو جمع‌بندی کرد. به عنوان مثال به دو اتفاق مهم سیاست خارجه‌ی آمریکا در زمان اوباما یعنی «توافق هسته‌ای» با ایران و «درگیری‌های داخلی لیبی» و کشته شدن سفیر آمریکا در این کشور فقط در حد یک جمله اشاره شده. در حالیکه اشاره به تماس‌ها، رفت و آمدها و حال و هوای کاخ‌ سفید در اون روزها می‌تونست برای خواننده جالب باشه. 

شاید هم میشل اوباما نیاز داشته تا زمان بیشتری از دوران حضورش در کاخ سفید بگذره تا دید بهتری نسبت به اتفاقات و جزئیات اون زمان پیدا کنه. 

 

در اینجا چند جمله از کتاب رو که به نظرم جالب بودن می‌نویسم:

- Now I think it's one of the most useless questions an adult can ask a child-what do you want to be when you grow up? As if growing up is finite. As if at some point you become something and that's the end.

 

- I realize I don't know exactly what my mom did during the hours we were at school, mainly because in the self-centered manner of any child, I never ased. I don't know what she thought about, how she felt about being a traditional homemaker as opposed to working a different job.

 

- She (my mom) and my dad offered guildlines rather than rules. It meant that as teenagers we'd never have a curfew. Instead, they'd ask, "what's a reasonable time for you to be home?" and then trust us to stick to our word. 

 

- I understand now that even a happy marriage can be a vexation, that it's a contract best renewed and renewed again, even quietly and privately-even alone.

 

- I wasn't going to let one person's opinion dislodge everything I thought I knew about myself. Instead, I switched my method without changing my goal. 

 

- This is what a control freak learns inside the compressed otherworld of college, maybe above all else: There are simply other ways of being.

 

- This may be the fundamental problem with caring a lot about what others think: It can put you on the established path. 

 

- Nothing was impossible, but nothing looked simple either.

 

- My father was  just fifty-five when he died. Suzanne (my friend) had been twenty-six. The lesson there was simple: Life is short and not to be wasted.

 

- I put myself in front of anyone I thought might be able to give me advice. The point was less to find a new job than to widen my understanding of what was possible and how others had gone about it.

 

- I began to see that there were ways I could be happier and that they didn't necessarily need to come from Barack's quitting poilitics in order to take some nine-to-six foundation job.(...this was an unrealistic expectation.) 

 

- Growing up in a working-class community and with a disabled parent, I'd learned that planning and vigilance mattered a lot. It could mean the difference between stability and poverty. The margins always felt narrow. One missed paycheck could have leave you without electricity; one missed homework assignment could put you behind and possibly out of college.

 

- Having lost a fifth-grade classmate to a house fire, having watched Suzanne die before she'd had a chance to really be an adult, I'd learned that the world could be brutal and random, that hard work didn't always assure positive outcomes. 

 

- There's an age-old maxim in the black community: You've got to be twice as good to get half as far.

 

- I knew from my own life experience that when someone shows genuine interest in your learning and development, even if only for ten minutes in a busy day, it matters.

 

- Life was teaching me that progress and change happen slowly. Not in two years, four years, or even a lifetime. we were planting seed of change, the fruit of which we might never see. We had to be patient. 

 

- Being president doesn't change who you are; it reveals who you are.

 

- For me, becoming insn't about arriving somewhere or achieving a certain aim. I see it instead as forward motion, a means of evolving, a way to reach continuously toward a better self.

 

 

۰ نظر
فربد صالحی

دوره‌ی مقدماتی data science - مقدمه‌ای بر آمار

این چهارمین بخش از خلاصه‌ی مجموعه‌ی «دوره‌ی مقدماتی data science» هستش. 

بخش اول - مقدمه

بخش دوم - مقدمه‌ای بر داده‌ها

بخش سوم - تصویرسازی از داده‌ها و تحلیل آنها

 

تحلیل آماری

تجزیه و تحلیل آماری رو میشه هسته‌ی اصلی data science دونست. با استفاده از آمار میشه به چگونگی توزیع داده‌ها، تاثیر اونها بر هم و موارد بسیار زیاد دیگه‌ای پی‌برد. نقطه‌ی شروع برای استفاده از آمار در تجزیه و تحلیل داده‌ها، درک «آمار توصیفی» هستش که با استفاده از اون می‌تونیم توزیع داده‌هامون رو تحلیل کنیم. 

اگه به ستون دما در جدول اطلاعات فروش لیموناد که در بخش‌های قبلی ازش استفاده کردیم توجه کنیم، به چه نتایجی از بازه‌ی دماها می‌رسیم؟

کمترین مقدار 20.0 هستش که در «نرم‌افزار اکسل» با تابع ()MIN=، بیشترین مقدار 64.2 هستش که در اکسل با تابع ()MAX= و متوسط دما که با جمع مقادیر و تقسیم اون بر تعداد به دست میاد برابر 44.62 هستش و در اکسل با استفاده از تابع ()AVERAGE= میشه بهش رسید. همونطور که مشخصه مقدار متوسط به احتمال زیاد اصلا بین داده‌های موجود وجود نداره.

یه روش دیگه در تحلیل داده‌ها محاسبه‌ی «میانه» هستش. برای این کار داده‌ها رو از کوچک به بزرگ مرتب می‌کنیم و داده‌ی وسط رو انتخاب کنیم، که اگه این رو روی دماهای ذکر شده در بالا اجرا کنیم، به 46.2 می‌رسیم. اگر هم تعداد داده‌ها زوج باشه،‌ از میانگین دو داده‌ی وسط استفاده می‌کنیم. در اکسل برای رسیدن به این مقدار از تابع ()MEDIAN= استفاده میشه. 

گاهی ممکنه نیاز داشته باشیم بدونیم که در یه بازه‌ی زمانی چه داده‌ای بیشتر از بقیه تکرار شده که بهش «مُد» گفته میشه. در اعداد تصویر بالا عدد 46.2 دوبار ذکر شده در حالیکه بقیه‌ اعداد یک بار اومدن. در اکسل از تابع ()MODE= برای رسیدن به این مفهوم استفاده میشه. گاهی ممکنه چند عدد مُد باشن، یعنی چند تا عدد داشته باشیم که مثلا دوبار در فهرست داده‌ها اومده باشن. 

برای تصویرسازی از فراوانی داده‌ها میشه از نمودار «هیستوگرام» استفاده کرد. در این نمودار، داده‌ها در دسته‌هایی با بازه‌ی مشخص در محور افقی و تعداد اعضای هر دسته در محور عمودی نمایش داده میشه. نمودار هیستوگرام اعداد بالا به صورت زیر هستش و همونطور که مشخصه، اعداد در بازه‌هایی به طول ۱۰ در محور افقی قرار گرفتن. در این نمودار خیلی سریع می‌تونیم متوجه شیم که بیشترِ روزها (۵ روز) دمایی در بازه‌ی ۴۰ تا ۵۰ داشتن. 

 

ما معمولا برای اینکه یه دید کلی از داده‌ها داشته باشیم، به خصوص وقتی حجم داده‌ها زیاده، از محاسبه‌ی میانگین استفاده می‌کنیم. اما گاهی ممکنه میانگین ما رو به اشتباه بندازه. به عنوان مثال، اگه دو مجموعه داده داشته باشیم، یکی شامل ۱ و ۹ و دیگری شامل ۶ و ۴، میانگین هر دو مجموعه میشه ۵. اگه در یه گزارش فقط عدد میانگین‌ها رو بگیم، ممکنه این برداشت بوجود بیاد که اعداد دو مجموعه به هم نزدیکن. در حالیکه می‌بینیم در مجموعه‌ی اول ۸ واحد و در مجموعه‌ی دوم ۲ واحد اختلاف بین اعداد وجود داره، یعنی پراکندگی داده‌ها تو مجموعه‌ی اول بیشتره. برای حل این مساله از مفهوم «انحراف معیار» و برای محاسبه‌ی انحراف معیار از مفهوم «واریانس» استفاده می‌کنیم. فرمول ریاضی واریانس به صورت زیر هستش:

ممکنه در ظاهر پیچیده به نظر بیاد ولی ساده است. μ میانگین داده‌ها و N تعداد داده‌ها است.Xهم عضو iاُم مجموعه. در واقع معنیش میشه اینکه اول میانگین داده‌ها محاسبه و بعد اختلافش با هرکدوم از داده‌ها به توان ۲ می‌رسه. بعد مجموع اونها تقسیم بر تعداد داده‌ها میشه. 

برای مجموعه‌ی اول و دوم در مثال بالا، میانگین داده‌ها برابر با ۵ هستش. برای مجموعه‌ی اول:

۳۲  = ۲(۹-۵) + ۲(۱-۵) 

حالا تقسیم ۳۲ بر تعداد اعداد یعنی ۲، واریانس رو به ما میده: ۱۶. اما برای مجموعه‌ی دوم: 

۲ = ۲(۶-۵) + ۲(۴-۵) 

و اگه ۲ رو تقسیم بر تعداد اعداد یعنی ۲ کنیم واریانس میشه ۱. اون چیزی که ما دنبالش بودیم انحراف معیار بود که در واقع با محاسبه‌ی «جذر» یا ریشه‌ی دوم واریانس به دست میاد. جذر یا ریشه‌ی دوم ۱۶ میشه ۴ و جذر یا ریشه‌ی دوم ۱ هم همون ۱ هستش. این اعداد به علت سادگی مجموعه‌ی داده‌ی ما، با چشم هم قابل ملاحظه است. یعنی فاصله‌ی ۱ و ۹ با عدد ۵ (میانگین) برابر ۴ و فاصله‌ی ۴ و ۶ با عدد ۵ برابر ۱ هستش. همونطور که واضحه، هر چقدر که پراکندگی داده‌ها کمتر باشه انحراف معیار هم کمتر خواهد بود. در اکسل، برای محاسبه‌ی واریانس از تابع ()VAR.P= و برای محاسبه‌ی انحراف معیار از تابع ()STDEV.P= استفاده میشه. 

نمودار هیستوگرام نشون میده که نمونه داده‌های مربوط به دما که دیدیم، از «توزیع نرمال» پیروی می‌کنه. در یه توزیع نرمال، میانگین، میانه، مُد و خط تقارن در وسط قرار دارند:

 

طبیعتا همه‌ی داده‌ها از توزیع نرمال پیروی نمی‌کنن. به عنوان مثال، در تصویر زیر داده‌های مربوط به مقدار بارندگی، نمودار هیستوگرام و مقادیر میانگین و میانه و مُد مربوطه رو می‌بینیم. مفهومی که بوسیله نمودار زیر می‌تونیم بهش بپردازیم تقارن تابع توزیع یا «چولگی» (skewness) هستش. این نمودار دارای چولگی به راست (right skewed) هستش. 

رابطه بین فیلدهای مختلف داده‌ها

گاهی نیاز داریم که رابطه‌ی بین چند فیلد از یه مجموعه‌ی داده رو بدونیم. مثلا می‌خوایم بدونیم چه رابطه‌ای بین دمای هوا و میزان فروش لیموناد برقراره. قبلا هم دیدیم که برای این کار از نمودار نقشه استفاده می‌کنیم و روند حاکم بر فیلدها رو بدست میاریم. این همون مفهوم «همبستگی» (correlation) هستش و میشه به صورت عددی میزان این همبستگی رو محاسبه کرد. برای این کار تو اکسل از تابع (,)CORREL= استفاده میشه.

همبستگی دو متغیر، مقداری بین -۱ تا +۱ داره. هر چقدر مقدار همبستگی به ۱ نزدیک‌تر باشه (+۱ یا -۱)، نشان‌دهنده‌ی قویتر بودن رابطه‌ی خطی بین دو متغیر هستش. رابطه‌ی خطی یعنی تغییر یکی از متغیرها، مقدار متغیر دیگر را هم تغییر می‌دهد که این تغییرها می‌توانند در یک جهت یا در خلاف جهت باشند. در این صورت می‌شه روی نمودار نقشه‌، خطی فرضی با شیب مثبت یا منفی (بر اساس منفی یا مثبت بودن همبستگی) بین نقاط رسم کرد. اما هر چقدر مقدار همبستگی به صفر نزدیک‌تر باشه، نشان‌دهنده‌ی پراکندگی داده‌ها و عدم ارتباط بین تغییرات اونهاست. 

در تصویر بالا، بعد از محاسبه می‌بینیم که میزان همبستگی بین دما و تعداد فروش برابر با 0.93 هستش که خیلی به +۱ نزدیکه و روی نمودار هم می‌بینیم که خطی با شیب مثبت تونستیم بین نقاط رسم کنیم. 

نکته‌ی آخر در این مورد اینکه، همبستگیِ زیاد بین دو فیلد لزوما به این معنی نیست که تغییر یک فیلد داده، «دلیلِ» تغییر در فیلد دیگه است. بلکه ممکنه فیلد سومی روی هر دو اثر گذاشته باشه یا حتی به طور تصادفی این همبستگی بینشون دیده بشه. 

 

بخش پنجم - مقدمه‌ای بر یادگیری ماشین

 

 

 

۰ نظر
فربد صالحی

کتاب Running Lean: شناخت بخش‌های پر ریسک طرح - برای آزمایش آماده شوید

این پُست ششمین بخش از مجموعه‌ی خلاصه‌ی کتاب Running Lean یا اجرای ناب هستش.

بخش اول: مقدمه

بخش دوم: نقشه‌ی راه - اصول فراگیر

بخش سوم: نقشه‌ی راه - یک مثال

 بخش چهارم: مستند کردن طرح - بوم ناب

بخش پنجم: شناخت بخش‌های پر ریسک طرح - اولویت بندی و انتخاب نقطه‌ی شروع

 

بعد از شناخت مدل‌های آغازین و اولویت‌بندی ریسک‌ها، حالا وقتشه که برای انجام آزمایش‌ها آماده بشید.

 

یک تیم مساله/راه‌حل آماده کنید.

قبل از شروع اولین مجموعه از آزمایش‌ها، جمع کردن یه تیم خوب کار مهمیه. بهتره تقسیم‌بندی‌های سنتی مثل «مهندسی»، "QA"، «بازاریابی» و مانند این رو فراموش کنید. به جای اون بهتره دو تا تیم ایجاد کنید: تیم مساله، تیم راه‌حل. 

تیم مساله

تیم مساله بیشتر درگیر فعالیت‌های بیرونی نظیر مصاحبه با مشتری‌ها، اجرای تست‌های قابلیت استفاده و .. خواهد بود.

تیم راه‌حل

تیم راه‌حل بیشتر درگیر فعالیت‌های درونی نظیر کدنویسی، اجرای تست‌ها، انتشار محصول و .. خواهد بود.

اندازه‌ی ایده‌آل برای تیم مساله/راه‌حل ۲ یا ۳ نفر هستش. دلایل زیادی برای ساخت محصول نسخه‌ی ۱.۰ (یا همون کمترین محصول قابل ارائه) با یه تیم کوچک وجود داره: تعامل راحت‌تر، توسعه‌ی کمتر، پایین نگه داشتن هزینه.

من بیشتر CloudFire رو خودم به عنوان تک بنیان‌گذار ساختم. بیشترین چالش من در برقراری تعادل بین فعالیت‌های دورنی و بیرونی بود. اما با وجود اینکه می‌تونید یه محصول رو خودتون به تنهایی بسازید، من شدیدا توصیه می‌کنم حداقل با یه نفر دیگه که می‌تونه در سنجش واقعیت‌ها به شما کمک کنه همکاری کنید. در حالت ایده‌ال این شخص می‌تونه «هم‌بنیانگذار» باشه،‌ اما حتی مشاورین، سرمایه‌گذاران و .. می‌تونن چنین نقشی رو ایفا کنن. 

 

سه موردی که اجباریه: توسعه، طراحی و بازاریابی

همیشه نیاز نیست که ۳ نفر برای تکمیل تیم داشته باشید. گاهی این سه نیاز رو میشه با ۲ نفر هم رفع کرد. من علاقه‌مند به پیدا کردن افرادی هستم که سطوحی از تخصص رو در هر سه حوزه داشته باشن. 

توسعه

اگه در حال ساخت یه محصول باشید، شدیدا در تیمتون نیاز به مهارت‌های توسعه‌ی محصول خواهید داشت. داشتن تجربه‌ی قبلی در توسعه کلیدی هستش، همراه با تخصص در تکنولوژی‌ خاصی که می‌خواید ازش استفاده کنید. 

طراحی

منظور از طراحی، زیبایی‌شناسی و کاربردپذیری است. شاید در بازارهای جدید اهمیت عملکرد نسبت به فرم و ظاهر بیشتر باشه،‌ اما هر چه زمان میگذره به میزان اهمیت شکل و ظاهر افزوده میشه.

بازاریابی 

هر چیز دیگری غیر از دو مورد قبل بازاریابی است. بازاریابی حس دیگران به محصول شما رو مدیریت می‌کنه و برای این کار شما نیاز به افرادی دارید که بتونن خودشون رو جای مردم بذارن. تبلیغات عمومی و مهارت‌های ارتباطی قوی در اینجا کلیدی است. 

نسبت به «برون‌سپاری» تیم مساله/راه‌حل محتاط باشید. من دائما تیم‌هایی رو می‌بینم که یک یا چند مورد از این سه جنبه رو برون‌سپاری می‌کنن که معمولا ایده‌ی بدی هستش. چون این کار شما رو محدود به زمان‌بندی دیگران میکنه و سرعت‌ عمل شما رو در چرخه‌های تولید پایین میاره. یکی از مواردی که هرگز نباید برون‌سپاری بشه آموختن درباره‌ی مشتری‌هاست. 

 

اجرای آزمایش‌های موثر

در این بخش قوانینی برای تعریف و اجرای آزمایش‌های مفید وضع می‌کنیم. 

بیشینه‌سازی سرعت، آموختن و تمرکز

از اونجایی که هدف یک استارتاپ یافتن طرحیست که پیش از اتمام منابع ما به جواب برسه، سرعت که از طریق مدت زمان چرخش حلقه‌ی «ساخت-سنجش-آموختن» اندازه‌گیری میشه، برای ما مهمه. همچنین ما می‌دونیم که آموختن، بویژه آموختن درباره‌ی مشتری‌ها مساله‌ی مهمیه. اما چیزی که خیلی بهش توجه نمیشه تمرکز هستش. 

شما به هر سه مورد سرعت، آموختن و تمرکز برای اجرای یک آزمایش بهینه نیاز دارید. ببینیم که اگه هر سه مورد رو با هم نداشته باشید چه حالت‌هایی پیش میاد.

سرعت و تمرکز دارید: وقتی شما سریع و متمرکز، ولی بدون آموختن کار می‌کنید، تصویر سگی به ذهن میاد که دُم خودش رو دنبال می‌کنه. شما انرژی زیادی صرف می‌کنید ولی دور خودتون می‌چرخید.

یادگیری و تمرکز دارید: وقتی شما روی چیز درستی متمرکز شدید و یاد هم می‌گیرید اما به اندازه‌ی کافی سریع حرکت نمی‌کنید، شما در خطر پایان منابعِ در دسترس یا جایگزین شدن توسط یه رقیب هستید.

سرعت و یادگیری دارید: اگه شما یاد می‌گیرید و سریع هم حرکت می‌کنید اما متمرکز نیستید، ممکنه در تله‌ی «بهینه‌سازی زودرس» بیفتید. مثلا سرورها رو قبل از اینکه مشتری‌ای داشته باشید گسترش بدید و یا کدها رو مرتب بهینه کنید در حالیکه هنوز محصولی ندارید که کار کنه. 


یه پارامتر کلیدی یا هدف، مشخص کنید

برای آماده‌سازی یه آزمایش، روی یه آموخته یا پارامتر کلیدی که نیاز دارید بهش برسید (و بر اساس نوع و مرحله‌ای که محصول شما در اون قرار داره می‌تونه متفاوت باشه) تمرکز کنید. 

کوچکترین چیز ممکن برای یادگیری رو انجام بدید

میگن «بهترین»، دشمنِ «خوب» هستش. ساده‌ترین کاری که برای آزمایش یه نظریه می‌تونید انجام بدید رو انتخاب کنید.

فرضیه‌هایی را در نظر بگیرید که قابل ابطال باشد

بیشتر افراد چیزهایی رو برای بیزینس مدلشون می‌نویسن که قابل سنجش نیست. در حالیکه «استارتاپ ناب» عمیقا ریشه در روش علمی داشته و نیاز داره که شما فرضیات خودتون رو به فرضیه‌هایی ابطال‌پذیر تبدیل کنید. فرضیه‌ی ابطال‌پذیر عبارتی هستش که میشه رد شدنش رو به طور واضح اثبات کرد. 

بدون این کار، شما به سادگی می‌تونید در دام شواهدی بیفتید که اثبات می‌کنه فرضیه‌ای که شما دارید درسته. در اینجا دو عبارت رو مقایسه می‌کنیم:

خیلی مبهم: شناخته شدن به عنوان یه «متخصص»، روی پذیرندگان اولیه تاثیرگذار خواهد بود.

مشخص و قابل سنجش: یک پُست وبلاگ باعث ۱۰۰ مورد عضویت خواهد شد.  

درست یا غلط بودن عبارت اول قابل اثبات نیست، چون میزان تاثیرپذیری پذیرندگان اولیه قابل اندازه‌گیری نیست. به طور خاص، مشخص نیست که چند پذیرنده‌ی اولیه نیازه تا درستی این عبارت ثابت بشه. یا مشخص نیست «متخصص بودن» دقیقا به چه معنیه. عبارت دوم نه تنها یه خروجی مشخص و قابل اندازه‌گیری داره، بلکه بر اساس یک اقدام مشحصِ قابل تکرار هستش که باعث میشه قابل سنجش باشه. فرضیه‌ی ابطال‌پذیر یعنی یه اقدام مشخصِ قابل تکرار به یه نتیجه‌ی مشخصِ قابل اندازه‌گیری برسه.  

اعتبارسنجی کیفی، تایید کمّی 

قبل از تناسب محصول/بازار، میزان عدم قطعیت بالاست و خبر خوب اینه که وقتی عدم‌قطعیت زیاده، برای آموختن نیاز به داده‌ی زیادی نیست. هدف اولیه‌ی شما اینه که یه «نشانه‌ی» قوی (مثبت یا منفی) به دست بیارید که به طور معمول نیاز به نمونه داده‌ی زیادی نداره. شما احتمالا در مصاحبه با ۵ مشتری به این هدف می‌رسید. یه نشانه‌ی منفیِ قوی بر این دلالت می‌کنه که فرضیه‌ی اصلی شما به احتمال زیاد جواب نمیده و این باعث میشه که یا خیلی زود اون رو بهبود بدید یا کلا فراموشش کنید. با این حال نشانه‌ی مثبتِ قوی لزوما به این معنی نیست که فرضیه‌ی شما با افزایش نمونه‌ی آماری همچنان نشانه‌ی مثبت دریافت کنه، با این حال این مجوز رو به شما میده که با این فرضیه ادامه بدید تا زمانی که از طریق داده‌های کمّی تایید بشه. اعتبارسنجی فرضیه‌ها از این طریق، یعنی ابتدا کیفی و سپس کمّی، یک اصل کلیدی است که در ادامه زیاد باهاش مواجه می‌شیم.

مطمئن شوید که می‌توانید نتایج به دست آمده را به اقدامات مشخصی مربوط کنید

وقتی آزمایش‌های کیفی انجام می‌دید، مثل مصاحبه‌ها، مهمه که اونها رو تا بروز یه الگوی تکرارپذیرِ قطعی به شیوه‌ی ثابتی ادامه بدید. برای آزمایش‌های کمّی، روش‌های مشخصی برای رسیدن به این هدف وجود داره که بعدا بیشتر بررسی می‌کنیم. 

شفافیت

سنجش فرضیه‌ها می‌تونه برای بنیانگذارها ترسناک باشه که قابل درکه. چون اونها دوست ندارن ثابت بشه که نتیجه‌ی تلاش‌هاشون اشتباهه. اما بدون وجود سطحی از شفافیت و واقع‌گرایی این خطر وجود داره که شما استارتاپ خودتون رو فقط براساس باور و اعتقاد شخصی بنا کنید. 

تبادل آموخته‌ها

در بازه‌های زمانی مشخص درس‌های آموخته‌شده از آزمایش‌ها رو بین اعضا به بحث بگذارید. برای تیم داخلی خودتون به طور هفتگی و برای مشاورین و سرمایه‌گذاران به طور ماهیانه. این به شما اجازه میده که توقف کنید، به عنوان یه تیم به یافته‌ها واکنش نشون بدید و برای فعالیت‌های بعدی برنامه‌ریزی کنید. به این دو گام آخر «حسابداری نوآوری» گفته میشه. تصاویر زیر مدل حسابداری نوآوری که من استفاده می‌کنم رو نشون میده.

 

هدف در اینجا، سنجیدن کمترین محصولِ قابل ارائه‌ی ماست. ابتدا خلاصه‌ای از آموخته‌های ما از یک دوره‌ی مشخص در ۳ بخش مجزا ارائه شده: آنچه انتظار داشتیم اتفاق بیفته (your hypotheses)، آنچه واقعا اتفاق افتاد (your insights)، و آنچه در آینده می‌خواهیم انجام دهیم (future experiments). در ادامه، به نحوه‌ی برخورد و استفاده‌ی مشتری‌ها با محصول پرداخته شده. این روش اجازه می‌ده که در حین اینکه دائما در حال حرکت به سمت طرحی هستید که جواب بده،‌ به یادگیری ادامه بدید. 

 

استفاده از ابَر الگوی تکرار (iteration) برای ریسک‌ها

با استفاده از آزمایش‌ها میشه با ریسک‌ها مواجه شد. قبل از تناسب محصول/بازار، اگرچه شما ممکنه بتونی تعدادی از ریسک‌ها رو کم کنی، اما نمی‌تونی با استفاده از یه آزمایش اونها رو به طور کامل حذف کنی. 

در اینجا دو تا اتفاق ممکنه بیفته. یکی اینکه استارتاپ‌ها ممکنه بر اساس نتیجه‌ی منفی یا حتی نه چندان خوب اولیه، خیلی زود به سراغ چرخش (pivot) برن و یا دیگه سراغ آزمایش‌های بیشتر نرن. دومی کاملا برعکسه. یعنی استارتاپ‌ها از نتایج مثبت اولیه بیش از حد خوش‌بین بشن، به طوریکه بعدا با مشکل مواجه بشن. 

اولین نقطه‌ی هدف برای یه استارتاپ، رسیدن به تناسب محصول/بازار هستش. این فقط به معنی ساخت یه محصول مناسب نیست،‌ بلکه شامل یه بیزینس مدل مقیاس‌پذیر (scalable) هستش که جواب بده. 

برای شما به صرفه نیست که کورکورانه فرایندی رو دنبال کنید یا آزمایش‌هایی رو فقط برای آموختن اجرا کنید. بلکه باید روندی رو دنبال کنید که آزمایش‌های شما در «تکرارهای مرحله‌ای» قرار بگیره و به این ترتیب اموخته‌های شما هربار افزایش پیدا کنه:

هر بار بیشترین آموخته‌ رو (درباره‌ی اینکه چه چیزی پر ریسک‌ترین هستش) به دست بیار. 

نقطه‌ی شروع، یه بوم ناب تکمیل شده‌ست که طرحی رو ارائه میده که شما معتقدید جواب میده. بعد شما به صورت روش‌مند آزمایش‌های مرحله‌ای رو اجرا می‌کنید که نواحی روی بوم رو پوشش میدن. 

قبلا مساله، کانال‌ها،‌ و جریان درآمد رو پر ریسک‌ترین موارد برای شروع دونستیم. در اینجا بررسی می‌کنیم که چطور به صورت ساختارمند با این ۳ مورد مواجه بشیم: 

مرحله‌ی ۱: فهمیدن مساله

با مشتری‌ها مصاحبه‌‌ی رسمی انجام بدید یا از سایر روش‌های آشنایی با مشتری استفاده کنید تا بفهمید که آیا مساله‌ای دارید که ارزش حل کردن داشته باشه؟ مساله مربوط به کیه؟ مساله‌ی اصلی چیه و الان چطور حلش میکنن؟  

مرحله‌ی ۲: تعریف راه‌حل

با استفاده از اطلاعاتی که از مرحله‌ی ۱ کسب کرده‌اید،‌ راه‌حلی تعریف کنید، یک دمو تهیه کنید که مشتری بتونه تصوری از راه‌حل شما داشته باشه و بعد اون رو با مشتری‌ها آزمایش کنید. راه‌حل شما جواب میده؟ پذیرنده‌ی اولیه کیه؟ مدل قیمت‌گذاری کار می‌کنه؟

مرحله‌ی ۳: اعتبارسنجی کیفی

کمترین محصول قابل ارائه‌ی خودتون رو تولید کنید و به پذیرنده‌های اولیه ارائه بدید. اونها می‌تونن ارزش پیشنهادی منحصر‌به‌فرد شمارو تشخیص بدن؟ چطور می‌تونید یه تعداد پذیرنده‌‌ی اولیه برای دریافت اطلاعات پیدا کنید؟ باید هزینه‌ای پرداخت کنید؟

مرحله‌ی ۴: تایید کمّی

محصول بهینه شده‌ی خودتون رو برای تعداد افراد بیشتری منتشر کنید. مردم چیزی که ساختید رو می‌خوان؟ چطور می‌خواید تعداد مشتری‌ها رو به سرعت افزایش بدید؟ کسب و کار شما به راحتی در دسترس مردم قرار داره؟

 

در اینجا نحوه‌ی مواجهه با آنها بر اساس ریسک‌ها ارائه شده:

- ریسک محصول: تولید محصولِ درست

۱- اول مطمئن بشید که مساله‌ای دارید که ارزش حل کردن داره.

۲- سپس کمترین محصول قابل ارائه رو تعریف کنید.

۳- کمترین محصول قابل ارائه رو تولید و اون رو در ابعاد کوچیک اعتبارسنجی کنید.

۴- در نهایت اون رو در ابعاد وسیع بررسی کنید.

- ریسک مشتری: برای دسترسی مشتری‌ها به محصول مسیری بسازید

۱- اول مشخص کنید چه کسایی با این مساله مواجهن.

۲- بعد اونها رو به پذیرندگان اولیه‌ای که همین الان حاضرن از محصول شما استفاده کنن محدود کنید.

۳- خوبه که کار رو از کانال‌های بیرونی (outbound channels) شروع کنید.

۴- اما به تدریج کانال‌های درونی مقیاس‌پذیر (scalable inbound channels) رو توسعه بدید، هر چه زودتر بهتر.

- ریسک بازار: یه کسب و کار ماندگار بسازید.

۱- از طریق سایر راه‌حل‌های موجود، رقابت رو تشخیص بدید و برای راه‌حل خودتون قیمتی تعیین کنید.

۲- قیمت‌گذاری رو اول از طریق چیزی که مشتری‌ها میگن بسنجید.

۳- بعد از طریق رفتار مشتری‌ها قیمت‌گذاری رو بسنجید.

۴- ساختار هزینه‌ی خودتون رو بهینه کنید تا بیزینس مدل‌تون جواب بده. 

 

 

بخش هفتم: سنجش ساختارمند طرح - آمادگی برای مصاحبه با مشتریان

 

 

 

۰ نظر
فربد صالحی

تصمیم و قضاوت

 

به عنوان یه رشتی طرفدار فوتبال، شناخت من از «علیرضا جهانبخش» به زمانی برمیگرده که تو تیم «داماش گیلان» بازی می‌کرد و تا جایی که می‌دونستم اهل شهر «رودبار» تو استان «گیلان» بود. خیلی جوون بود و از بازیش مشخص بود که می‌تونه آینده‌ی خوبی داشته باشه. روندی که اون موقع می‌شد برای همچین بازیکنی در نظر داشت این بود که به یه تیم بزرگتر و ثروتمندتر، مثلا «سپاهان» یا «ذوب‌آهن» بره و اگه دچار اُفت و حاشیه‌های معمول فوتبالیست‌های جوون تو فوتبال ایران نشه، به یکی از تیم‌های «استقلال» یا «پرسپولیس» منتقل بشه. البته موردهایی هم بودن که مستقیما از یه تیم کوچک به یکی از دو تیم‌ بزرگ تهران منتقل شده بودن و این گزینه هم محتمل بود.

اما خبری که از جهانبخش بعد از ۲ فصل حضور تو تیم داماش منتشر شد، انتقالش به یه تیم «هلندی» بود. بعد از حضور تیم ملی ایران تو جام جهانی ۱۹۹۸، انتقال بازیکن‌های ایرانی به لیگ‌های اروپایی و بخصوص «آلمانی» چیز عجیبی نبود، اما سال‌ها ازون دوران گذشته بود و حالا اینکه بازیکنی از ایران تو سن خیلی پایین و مستقیما از یه تیم کوچک به تیمی تو یه لیگ آبرومند اروپایی بره خبر هیجان‌انگیزی بود، هر چند نگرانی‌هایی هم مطرح میشد. مثلا اینکه عدم تجربه‌ی حضور تو تیم‌های بزرگ ایرانی و یا حتی عدم حضور در لیگ‌‌های متوسط کشورهای همسایه مثل «قطر» و «امارات» باعث نشه که جهانبخش زیر فشار زیاد بازی‌های اروپایی نتونه عملکرد خوبی از خودش نشون بده و اصطلاحا بسوزه.

اما خبرهایی که از حضور جهانبخش تو هلند میومد خیلی خوب بود، طوریکه بعد از ۲ فصل، به یه تیم بزرگتر هلندی منتقل شد و تو فصل سوم حضورش تو اون تیم هم «آقای گل» لیگ برتر هلند شد که خیلی افتخار بزرگی بود. بعد از ۵ فصل حضور در فوتبال هلند، علیرضا جهانبخش با یه مبلغ قابل توجه به تیم «برایتون» انگلیس منتقل شد که تبدیلش کرد به گرانترین خرید تاریخ این باشگاه انگلیسی.

این انتقال از جهات زیادی تفاوت داشت با تجربه‌های قبلی علیرضا، چون لیگ برتر انگلیس یکی از سطح بالاترین لیگ‌های فوتبال دنیاست و ضمنا معروفه که مسابقاتش بسیار درگیرانه انجام میشه و قدرت بدنی و تمرکز بالایی می‌طلبه. خیلی خلاصه اینکه اوضاع واسه علیرضا تو انگلیس اونطور که باید پیش نرفت. تو فصل اول بازی‌های کمی انجام داد، نه گلی زد و نه تونست پاس گلی بده و این برای خرید یه باشگاه که گرانترین خرید تاریخ باشگاه هم هستش یه فاجعه محسوب میشه. مسلما طرفدارها و رسانه‌ها انتقاد می‌کنن و باشگاه و سرمربی زیرفشار قرار میگیرن. تو فصل دومش هم که همین فصل ۲۰۱۹-۲۰۲۰ هستش، اوضاع بدتر شد و کلا مربی تو ترکیب تیم قرار نمی‌دادش.

حالا دیگه بحث و انتقاد از داخل ایران هم شنیده می‌شد. بعضی‌ها معتقد بودن که رفتن به انگلیس از اولش اشتباه بود: وقتی توی هلند موفق بودی چرا رفتی یه کشور دیگه. فوقش میرفتی یه تیم بهتر، مثلا «آژاکس». بعضی‌ها هم میگفتن عجله کردی و کار درست این بود که به جای لیگ برتر انگلیس، از لیگ رده پایین‌تر این کشور (لیگ دسته‌ی اول) شروع می‌کردی تا کم کم جا بیفتی. این بحث هم مطرح بود که بهتره جهانبخش تا یه فصل رو کلا از دست نداده زودتر تیمش رو عوض کنه و حتی دوباره برگرده هلند. اما از مدیر برنامه‌های علیرضا خبر می‌رسید که علیرضا تصمیم داره بمونه و تلاش کنه.

امروز که دوم ژانویه 2020 هستش، علیرضا جهانبخش توی دو بازی پی در پی تو لیگ برتر انگلیس برای تیمش گل زده. اولیش رو قبل از اینکه هنوز بازی به دقیقه‌ی ۳ برسه زد که سریع‌ترین گل تاریخ برایتون تو لیگ برتر بوده و دومیش رو هم در دقایق انتهایی بازی با تیم بزرگ «چلسی»، با یه «قیچی برگردون» زیبا که باعث شد تیمش از شکست نجات پیدا کنه.

میشه تصور کرد که روزها و ماه‌های قبل از این دو تا گل چه فکرهایی از ذهنش گذشته. اینکه شاید این حرفهایی که کارشناس‌ها و رسانه‌ها در مورد انتخاب تیم و .. میزنن درسته. واقعا من اینقدر که برام هزینه شده ارزش دارم؟ چرا دیگه نمی‌تونم گل بزنم؟ اگه مربی تیم دیگه بهم بازی نده چی؟ چه کاری درسته؟ با همین تیم ادامه بدم یا تیمم رو عوض کنم؟ 

تصویر بالا که مربوط به بعد از اولین گلش تو لیگ برتر انگلیس میشه، نشون میده که این بازیکن از چه فشار روانی شدیدی رها شده. بعد از گل دومش هم که به طرز زیبایی به ثمر رسوند، همه دارن تحسینش می‌کنن که «موند و جنگید، تسلیم نشد، حاضر نشد به عقب برگرده و حالا داره مزد زحماتش رو می‌گیره».

خیلی وقتها قضاوتی که ما درباره‌ی تصمیم‌ها و انتخاب‌های دیگران داریم، فقط معطوف به «نتیجه‌» هستش. تا موقعی که گل بزنن و بدرخشن، همه‌چی درست و به موقع بوده، ولی اگه تو مقطعی دچار مشکل و اُفت بشن، باید خودشون رو برای انتقاد و سرزنش آماده کنن.

خیلی کلی‌تر، شاید بشه گفت هر چقدر که تو زندگی جلوتر میریم، هر چقدر تصمیم‌ها مهم‌تر و سرنوشت‌سازتر میشن، دیگه کمتر می‌تونیم قاطعانه بگیم چه کاری درسته و چه کاری غلط. شاید تنها کاری که ازمون بربیاد این باشه که تا جای ممکن اطلاعات جمع کنیم، با افراد با تجربه‌تر مشورت کنیم و با در نظر گرفتن همه‌ی جوانب تصمیم بگیریم. ولی بهتره بدونیم که هیچ تضمینی برای رسیدن به نتیجه‌ی دلخواه وجود نداره و باید برای هر نتیجه‌ای و بر اساس اون نتیجه، برای هر قضاوتی توسط بقیه‌ی افراد آماده باشیم.   

 

 

۰ نظر
فربد صالحی

دوره‌ی مقدماتی data science - تصویرسازی از داده‌ها و تحلیل آنها

این سومین بخش از خلاصه‌ی مجموعه‌ی «دوره‌ی مقدماتی data science» هستش. 

بخش اول - مقدمه

بخش دوم - مقدمه‌ای بر داده‌ها

 

توابع تجمیعی (aggregate functions)

در بخش قبلی با یکی از توابع تجمیعی یعنی «مجموع» آشنا شدیم و جمع مقادیر ستون درآمد رو محاسبه کردیم. عملیات تجمیعی یکی از ابتدایی‌ترین کارهایی هستش که معمولا روی داده‌ها انجام میدیم تا بتونیم به یه خلاصه و جمع‌بندی از اونها دست پیدا کنیم. متداول‌ترینِ این توابع شامل تعداد(Count)، مجموع(Sum)، میانگین(Average)، کمترین مقدار(Min) و بیشترین مقدار(Max) هستش. در زیر نتیجه‌ی اِعمال این توابع روی ردیف داده‌هامون رو می‌بینیم:

 

 

بسته به نوع داده، نتیجه‌ی بعضی توابع تجمیعی ممکنه کاربردی نداشته باشه. مثلا در جدول بالا، عملیات جمع (Sum) روی دما و قیمت، خروجی معناداری تولید نمی‌کنه. نکته‌ی دیگه اینکه روی بعضی داده‌ها، مثل روز هفته که برای دسته‌بندی اطلاعات استفاده میشه، محاسبه‌ی تعداد (Count) کمکی به ما نمی‌کنه و مثل جدول بالا بهتره از تعداد تفکیکی (DCount) استفاده کنیم. 

وقتی داده‌های ما براساس یک یا چند فیلد دسته‌بندی شده باشن، مثلا بر اساس فیلد روزهای هفته یا قیمت، می‌تونیم توابع تجمیعی رو به طور جداگانه روی هر کدوم از دسته‌ها اِعمال کنیم:

در تصویر بالا، «میانگین» دما و بارندگی، و «مجموع» تعداد آگهی و تعداد فروش و مقدار درآمد براساس روزهای هفته به طور جداگانه محاسبه شده. 

وقتی بیشتر از یک دسته در داده‌ها وجود داشته باشه، می‌تونیم داده‌ها رو به طور سلسله‌مراتبی «گروه‌بندی» کنیم. به عنوان مثال اگه تو جدول ابتدای این بخش دقت کنیم می‌بینیم که قیمت تو بعضی روزها 30 سِنت و تو بعضی روزها 50 سِنت هستش، یعنی ردیف‌ها بر اساس قیمت به دو دسته تقسیم میشن. اینجا می‌تونیم ابتدا ردیفها رو براساس قیمت گروه‌بندی کنیم و بعد توابع تجمیعی رو روی روزهای مختلف اِعمال کنیم:

اگه به تصویر زیر دقت کنیم متوجه می‌شیم که مجموع درآمد تو روزهایی که قیمت ۵۰ سِنت بوده (52.00)  با وجود فروش کمتر (104) بیشتر از روزهایی هستش که قیمت ۳۰ سِنت بوده (35.70) با وجود فروش بیشتر (119). شاید بشه نتیجه گرفت که فروش با قیمت ۵۰ سِنت به‌صرفه‌تر هستش. ضمن اینکه می‌بینیم تو روزهای جمعه، وقتی قیمت ۵۰ سِنت بوده، با وجود تعداد آگهی کمتر مقدار فروش و درآمد بیشتر بوده:

 

 

تصویرسازی از داده‌ها

استفاده از نمودار و گراف و به طور کلی تصویرسازی از داده‌ها به ما کمک می‌کنه که سریع‌تر و راحت‌تر بتونیم اطلاعات مورد نیاز رو از داده‌های موجود استخراج کنیم. 

در تصویر زیر یه نمودار خطی (line) ساده رو می‌بینیم که درآمد روزانه رو در بازه‌ی دو هفته‌ای نشون میده. در اینجا درآمد (محور عمودی) به صورت نقطه‌ای متناظر با تاریخ مربوطه (محور افقی) نمایش داده شده و از اتصال این نقاط به هم، این نمودار به دست اومده. 

به طور کلی به محور افقی نمودارها، محور Xها و به محور عمودی نمودارها، محور Yها گفته میشه. نمودارها معمولا شامل توضیح علائم (legend) هم هستن. مثلا تو تصویر بالا می‌فهمیم که خط آبی نمودار نشون‌دهنده‌ی درآمد (Revenue) هستش. مورد بعدی عنوان نمودار هستش که نشون میده نمودار قراره چه چیزی رو به ما اطلاع بده. مثلا در نمودار بالا، "Revenue Over Time" نشون میده که هدف نمودار، نمایش درآمد در طول زمان هستش. 

نمودار دایره‌ای (Pie) نوع دیگه‌ای از نمودارهاست که استفاده ازش متداول هم هست. همونطور که مشخصه این نوع نمودار محور عمودی و افقی نداره و مقادیر رو بر اساس مساحت اختصاص داده شده در سطح دایره نمایش میده. به عنوان مثال نمودار دایره‌ای زیر نشون میده که هر کدوم از روزهای هفته چه درصدی از میزان درآمد رو به خودشون اختصاص میدن. روز یکشنبه با ۱۸ درصد بالاترین سهم و روز جمعه با ۱۲ درصد پایین‌ترین سهم رو در درآمد دارن.  

 

استفاده از نمودار میله‌ای(bar) یا ستونی(column) روش دیگه‌ای در تصویرسازی داده‌هاست. در نمودار میله‌ای زیر، هر میله یا ستون نشون‌دهنده‌ی یه روز هفته و ارتفاع هر میله نشون‌دهنده‌ی مقدار درآمد کسب شده در اون روز هستش. 

اگه چند دسته داده داشته باشیم، مثل روزهای هفته و قیمت فروش، می‌تونیم از چند نوع میله یا ستون استفاده کنیم. مثلا تو نمودار زیر، میله‌های آبی نشون‌دهنده‌ی درآمد با فروش ۳۰ سِنت و میله‌های نارنجی نشون‌دهنده‌ی درآمد با فروش ۵۰ سِنت هستن. 

اگه نیاز داشته باشیم که یک روند رو بر اساس تغییرات دو داده‌ی مرتبط نشون بدیم، می‌تونیم از نمودار نقشه‌ای(plot) استفاده کنیم. نمودار زیر دما رو روی محور Xها، تعداد فروش رو روی محور Yها و تعداد فروش در هر دما رو با یه نقطه‌ی آبی نشون میده. روندی که می‌تونیم بیینیم اینه که هر چه دما بالاتر بوده، تعداد فروش هم بیشتر شده و برعکس. خط نارنجی این روند رو به ما نشون میده.  

 

بخش چهارم: مقدمه‌ای بر آمار

 

۰ نظر
فربد صالحی

کتاب Running Lean: شناخت بخش‌های پر ریسک طرح - اولویت بندی و انتخاب نقطه‌ی شروع

این پُست پنجمین بخش از مجموعه‌ی خلاصه‌ی کتاب Running Lean یا اجرای ناب هستش.

بخش اول: مقدمه

بخش دوم: نقشه‌ی راه - اصول فراگیر

بخش سوم: نقشه‌ی راه - یک مثال

 بخش چهارم: مستند کردن طرح - بوم ناب

 

ریسک چیه؟

ما می‌دونیم که استارتاپ‌ها با مساله‌ی «عدم قطعیت» مواجهن، ولی عدم قطعیت و ریسک دو تا چیز متفاوتن. ما می‌تونیم در مورد چیزای زیادی دچار عدم قطعیت باشیم، در حالیکه اون چیزا دارای ریسک نیستن. عدم قطعیت رو میشه «وجود بیشتر از یک حالت ممکن» دونست، در حالیکه ریسک رو میشه نوعی از عدم قطعیت دونست که در اون «بعضی از حالت‌های ممکن، نتایج ناخوشایندی خواهند داشت».

بوم ناب به طور خودکار عدم قطعیت‌هایی رو که در عین حال ریسک هم هستن مشخص می‌کنه. اما ریسک‌ها با هم متفاوتن. سنجش احتمال بروز یک نتیجه‌ی خاص، به همراه سنجش میزان خسارت در صورتی که شما در این کار مرتکب اشتباه بشید، روش سنجش ریسک در بیزینس مدل شماست.  

به عنوان مثال،‌ تو مطالعه‌ی موردی مربوط به نوشتن این کتاب که قبلا بررسی کردیم،‌ من قیمت رو به عنوان یه ریسک بالا در نظر نگرفتم، چون با وجود اینکه خسارت ناشی از عدم خرید کتاب خیلی بزرگ بود، احتمال این اتفاق با توجه به کتاب خوبی که می‌خواستم بنویسم پایین بود. به همین دلیل به جای قیمت، تمرکز خودم رو روی فهرست مطالب قرار دادم. 

در هر استارتاپ سه نوع ریسک کلی میشه در نظر گرفت: ریسک محصول (P)، ریسک مشتری (C) و ریسک بازار (M). مواجهه‌ی همزمان با همه‌ی این ریسک‌ها سخته، به همین دلیل باید بر اساس موقعیت محصول این ریسک‌ها رو اولویت‌بندی کرد و به طور ساختارمند با اونها مواجه شد. 

 

در حالیکه پرریسک‌ترین بخش مدل شما بر اساس نوع محصولی که قصد ساختش رو دارید متفاوت خواهد بود، ریسک‌هایی وجود دارند که عمومی‌ترن و نقطه‌ی شروع خوبی برای رتبه‌بندی بیزینس مدل‌ها هستن.

 

رتبه‌بندی بیزینس مدل‌ها

الان وقتشه که بوم‌های نابی که دارید رو کنار هم قرار بدید و بر اساس اولویت‌ها تصمیم بگیرید که با کدوم مدل شروع کنید. هدف ما در اینجا رسیدن به مدلیه که یه بازارِ به اندازه‌ی کافی بزرگ و مشتری‌هایی نیازمند به محصول ما داره، محصولی که می‌تونیم بر اساس اون یه کسب و کار راه بندازیم. 

من از این ترتیب وزنی استفاده می‌کنم، از بیشترین به کمترین:

۱- میزان نیاز مشتری (مساله)

دسته‌های مشتری‌ رو بر اساس میزان نیازشون به محصولتون اولویت‌بندی کنید. هدف رسیدن به مهم‌ترین مساله‌های مشتری‌هاست. 

۲- سهولت دسترسی (کانال‌ها)

ساخت یه مسیر دسترسی برای مشتری‌ها یکی از سخت‌ترین جنبه‌های ساخت یه محصول موفقه. اگه مسیر راحتی برای یه دسته از مشتری‌ها دارید، اون رو هم درنظر بگیرید. البته این تضمین نمی‌کنه که شما بتونید برای این دسته از مشتری‌ها مساله‌ای پیدا کنید که ارزش حل کردن داشته باشه.

۳- قیمت و سود (جریان‌های درآمد/ ساختار هزینه)

اینکه چقدر پول واسه محصولتون می‌تونید دریافت کنید تا حد زیادی به دسته‌ی مشتری مربوط میشه. دسته‌ی مشتری‌ای رو انتخاب کنید که به شما اجازه میده حاشیه‌ی سودتون رو بیشتر کنید. هر چه حاشیه‌ی سودتون بیشتر باشه، نیاز شما به پیدا کردن مشتری کمتر میشه. 

۴- اندازه‌ی بازار (دسته‌های مشتری‌)

دسته‌ای از مشتری‌ها رو انتخاب کنید که بازار بزرگی رو برای رسیدن به اهداف تجاری شما نمایندگی می‌کنن.

۵- امکان فنی (راه‌حل)

بررسی کنید که راه‌حل طراحی شده‌ی شما نه تنها عملی باشه، بلکه حداقل ویژگی‌های مورد نیاز مشتری رو ارائه کنه.

مطالعه‌ی موردی: CloudFire، اولویت‌بندی شروع

تصاویر زیر بوم‌های ناب CloudFire رو بر اساس رتبه‌بندی اونها نشون میده:

بوم والدین:

 

بوم عکاس‌ها:

 

بوم فیلمبردارها:

 

بوم مصرف‌کنندگان:

 

اگرچه دسته‌ی فیلم‌بردارها بیشترین حاشیه‌ی سود رو داره(با ۱۰۰ مشتری به نقطه‌ی سر به سر می‌رسید)،‌ اما چالش‌های تکنیکی زیادی در کار با فایل‌های حجیم (که اکثرا فایل‌های ویدئویی هستن) وجود داره. دسته‌ی مصرف‌کنندگان هم ضعیف‌ترین ارزش پیشنهادی و سخت‌ترین مدل درآمدزایی رو داره. براساس این رتبه‌بندی، من تصمیم گرفتم که با دسته‌های والدین و عکاس‌ها شروع کنم. 

 

مشورت با دیگران

این ضروری است که شما مدل خود را با حداقل یک نفر دیگر مطرح کنید.

من قبلا بعد از مستندسازی مدل اولیه بلافاصله سراغ مصاحبه با مشتری‌ها می‌رفتم،‌ اما حالا ترجیح میدم اول یه زمانی رو برای اولویت‌بندی ریسک‌ها و فکر کردن به مدل‌های جایگزین با افرادی غیر از مشتری‌ها، یعنی مشاورین صرف کنم. 

علت اصلی این کار افزایش سرعت و یادگیری هستش. مشتری‌ها نمی‌تونن مستقیما جواب همه‌ی سوال‌ها رو داشته باشن. ضمن اینکه انتخاب دسته‌ی مشتری ممکنه بدرستی انجام نشه. 

اما از طرف دیگه، مشاورین مناسب می‌تونن تو تعیین ریسک‌های کلی طرح و همچنین اصلاح و یا حتی حذف بعضی از مدل‌ها به شما کمک کنن. 

مشاور ابتدای کار ممکنه یکی از مشتری‌های اولیه، یه سرمایه‌گذار بالقوه، یه کارآفرین با تخصصی خاص یا یه شخص آگاه از حوزه‌ی فعالیت باشه. به عنوان مثال، من بعد از فروش آخرین شرکتم، آموخته‌های خودم از CloudFire رو با چندتا کارآفرین که اونها هم قصد داشتن والدین رو به عنوان مشتری انتخاب کنن به اشتراک گذاشتم. 

چندتا راهنمایی برای اجرای مصاحبه‌های مرتبط به بیزینس مدل:

۱- خودداری از روش ارائه با اسلایدهای ۱۰ قسمتی

از اونجایی که هدف ما در اینجا کسب اطلاعات هستش، من از اسلاید استفاده نمی‌کنم. به جای اون من از روش تکمیل تدریجی بوم ناب استفاده می‌کنم، یعنی با یه بوم خالی شروع می‌کنم و همینطور که جلو می‌رم بخش‌های مختلفش رو نمایش می‌دم. 

۲- اختصاص ۲۰ درصد زمان به ارائه و ۸۰ درصد زمان به گفتگو

معمولا ۳ تا ۵ دقیقه زمان برای توضیح مدل بوسیله‌ی من کافیه و بقیه زمان رو صرف گوش کردن می‌کنم. چیزی که من متوجه شدم اینه که اگه بوم تکمیل شده رو جلوی افراد باز بذارم،‌ اونا می‌تونن یه تصویرسازی از کل مدل انجام بدن و نظرشون رو ابراز کنن. 

۳- پرسیدن سوالات مشخص

من بطور خاص می‌خوام بدونم که:

- اونها کدوم جنبه از طرح رو پر ریسک‌تر می‌دونن. 

- اونها تجربه‌ی غلبه بر ریسک‌های مشابه رو داشتن؟ چطور؟

- اونها چطور این ریسک‌ها رو آزمایش کردن؟

- افراد دیگه‌ای هستن که صحبت با اونها می‌تونه به من کمک کنه؟

۴- مواظب «تناقض مشاور» بودن

همونطور که هدف ما از مصاحبه با مشتری‌ها این نیست که ازشون بپرسیم چی می‌خوان، هدف مصاحبه با مشاور هم این نیست که بپرسیم چکار باید کرد.

تناقض مشاور: مشاورها رو برای کسب توصیه‌‌ی خوب به کار بگیر، اما دنباله‌روی اون نباش، بلکه ازش استفاده کن. 

 از بازخوردها نه به منظور اعتبارسنجی، بلکه به منظور شناسایی و اولویت‌بندی ریسک‌ها باید استفاده کرد.

۵- به کارگیری مشاوران با بصیرت

همونطور که پذیرندگان اولیه علاقه دارن برای رفع مشکلاتشون به شما کمک کنن،‌ مشاورین با بصیرت هم وقتی مسائل جالبی رو باهاشون مطرح می‌کنید با شور و اشتیاق زیادی سعی می‌کنن به شما کمک کنن. شما می‌تونید این نوع از مشاورین رو از جواب‌ها و زبان بدنشون بشناسید. اگه با چنین مواردی برخورد کردید، اونها رو برای بکارگیری به عنوان مشاور رسمی خودتون در آینده در نظر داشته باشید.  

 

بخش ششم: شناخت بخش‌های پر ریسک طرح - برای آزمایش آماده شوید

 

 

 

 

۰ نظر
فربد صالحی

ذهن آلوده

 

روز جمعه فرصتی پیش اومد که ماشین رو ببرم کارواش. طبیعتا خیلی‌های دیگه هم جمعه رو برای این کار انتخاب کرده بودن و بیشتر از یک ساعت طول کشید تا کار ماشین تموم شه. وقتی وارد اتاق انتظار کارواش شدم، تلویزیون روشن بود و فیلم «دست‌های آلوده» پخش می‌شد. فکر کنم قبلا دو بار این فیلم رو دیده بودم. یه بار همون موقع اکرانش تو سینما حدودای سال ۷۸-۷۹ و یه بار هم چند سال قبل.

بار اول که اصلا خوشم نیومده بود. اون سالها سرعت تحولات اجتماعی و سیاسی خیلی زیاد بود، یا حداقل خیلی‌ها مثل من اینطور فکر می‌کردن و انتظار داشتن واقعا تحولی اتفاق بیفته. فیلم‌ها، کتاب‌ها و ترانه‌ها فقط وقتی واسه من قابل قبول بودن که «پیام» اجتماعی یا سیاسی می‌داشتن. مثلا از فیلم‌های «دو زن» (تهمینه میلانی، ۱۳۷۷) و یا «زیر پوست شهر» (رخشان بنی‌اعتماد، ۱۳۷۹) خوشم اومده بود، ولی از «قرمز» (فریدون جیرانی، ۱۳۷۷) یا همین فیلم دست‌های آلوده (سیروس الوند، ۱۳۷۸) نه. یعنی به نظرم خوب ساخته شده بودن، ولی میگفتم خب که چی، داستان چندتا آدم چرا باید واسه من جالب باشه آخه.

بار دوم که ۴-۵ سال قبل بود، تو یه موقعیت تقریبا اجباری فیلم رو دیدم. دیگه اون ذهنیت‌ها در مورد پیام اثر و این حرف‌ها رو نداشتم، اما خیلی جدی نگرفتمش و با همون ذهنیتی که از تماشای دفعه‌ پیش برام ایجاد شده بود دیدمش. فیلم که تموم شد با خودم گفتم انگار اونقدرها هم بد نبود، حتی شاید تو سبک خودش تو سینمای ایران خوب هم بود.

اما این دفعه فرق داشت. منی که ۳۵ سالگی رو رد کردم، تو آخرین جمعه‌ی پاییز سال ۱۳۹۸، در حالیکه بین غریبه‌هایی نشستم که اکثرشون تو سکوت مشغول موبایل‌هاشون هستن و آفتاب کم‌رمقِ وسط روز هم از پنجره به داخل اتاق می‌تابه، یه بار دیگه فیلم دست‌های آلوده رو دیدم. منی که یکی دو سالی هستش که تقریبا خیالم از بابت هر بهبودی در شرایط کشور راحت! شده و چند ماهی هم میشه که حتی از نظر شخصی هم چشم‌انداز روشنی واسه خودم نمی‌بینم. 

این دفعه چون داستان رو می‌دونستم، بیشتر به خود شخصیت‌های فیلم توجه کردم. عجیب بود که این دفعه برام خیلی باور‌پذیرتر بودن. احساساتشون، غصه‌هاشون و آرزوهاشون رو درک کردم. یه جورایی انگار از گذشته‌شون هم مطلع بودم بدون اینکه فیلم خیلی بهش پرداخته باشه. انگار وقتی ذهنم به خاطر جبر زمانه، بالا رفتن سن و یا مواجه شدن با واقعیت‌های زندگی از آلودگی به امیدها و آرزوهای پوچ و کاذب پاک شد، تواناییش تو درک آدم‌ها و احساساتشون هم بیشتر شد، بیشتر و بهتر دید همه‌چیز رو.

من دیدم که «ابوالفضل پورعرب» چقدر پخته بازی کرد، از دوره‌ی جوونی و اوج گذشته بود، ولی هنوزم ستاره بود. من «هدیه تهرانی» رو دیدم. برخلاف الان که خیلی کم کار شده، اون روزا سوپر استار سینمای ایران بود. الان تازه می‌فهمم که چرا جوونا اینقدر دوسش داشتن و همه‌ی فیلماشو میدیدن، چقدر دیر فهمیدم! «امین حیایی» چقدر جوونتر از الانش بود، چه جوون خوش‌قیافه‌ای هم بود. «عسل بدیعی» چقدر با احساس بازی کرد. یه لحظه فکر اینکه دیگه تو این دنیا نیست تکونم داد و ...البته ترانه‌ی زیبای «پروانگی» با صدای پر قدرت «نیما مسیحا» و آهنگ و تنظیم زیبای مرحوم «بابک بیات» رو شنیدم.

ای کاش دیگه ذهنم رو آلوده‌ی توهمات نکنم، دریچه‌های ذهنم رو باز بذارم و از آدم‌ها، احساسات و زندگیشون راحت و بی‌تفاوت نگذرم. البته احتمالا واسه افرادی مثل من، این کار سختیه و فقط هر از چندگاهی که یادم بیفته باعث میشه حسرت بخورم.

 

مثلِ یه پروانه ببین، اسیر مشتِ بسته‌ام

از این همه پرسه‌زدن، کوچه به کوچه، خسته‌ام

تو لحظه‌های بی‌کسی، اسیر ناباوری‌ام

تو قاب خالی جنون، یه عکس خاکستری‌ام

-----

توی این ثانیه‌های بی‌رمق، لحظه‌های آبیتو حروم نکن

این روزا ابری و خاکستریه، شبای آفتابیتو حروم نکن

بگو خورشید از کدوم ور در اومد، که تو مثل قصه رویایی شدی

ماهی زخمی پاشوره‌ی حوض، کیو خواب دیدی که دریایی شدی

-----

برای من، که رفیق سفرم، مرهم زخمای خستگی، تویی

برای من که غریب جاده‌هام، آخرین همدم خونگی، تویی

از رو گلبرگ گلای کاغذی، اشکامو با دست آلوده بچین

منو، تو آینه ها شستشو بده، تو چشام حادثه‌ی عشقو ببین

 

ترانه‌سرا: پیام پارسا

۰ نظر
فربد صالحی

دوره‌ی مقدماتی data science - مقدمه ای بر داده‌ها

این دومین بخش از خلاصه‌ی مجموعه‌ی «دوره‌ی مقدماتی data science» هستش. 

بخش اول - مقدمه

چیزی که مشخصه اینه که data science در مورد کاوش داده‌هاست. اما واقعا به چه چیزی داده گفته میشه؟

با یه مثال ساده شروع می‌کنیم. فرض می‌کنیم که «رُزی» تو وقت آزادش کنار خیابون لیموناد می‌فروشه و به دقت اطلاعات فروشش رو به صورت زیر ثبت میکنه:

 

 

همونطور که مشخصه، رُزی تاریخ (date)، روز هفته (day)، دما (temperature)، میزان بارندگی (rainfall)، تعداد برگه‌های تبلیغاتی که پخش کرده (flyers)، قیمت (price) و تعداد فروش (sales) رو ثبت کرده. در نتیجه می‌تونه آمار فروشش رو تجزیه و تحلیل کنه.

ستون Date از نوع داده‌ی «زمانی» هستش. این نوع داده‌ها ترتیب مشخصی دارن. مثلا ۲ ژانویه بعد از ۱ ژانویه و قبل از ۳ ژانویه است و به همین ترتیب. روی این نوع داده میشه عملیات محاسباتی انجام داد که البته متفاوت با عملیات محاسباتی‌ای هستش که روی داده‌های عددی انجام میشه. 

ستون Day نمونه‌ای از نوع داده‌ی «متنی» هستش. از این نوع داده میشه برای دسته بندی ردیف‌ها استفاده کرد. مثلا ردیف‌های مربوط به روزهای پنجشنبه و جمعه رو به عنوان اطلاعات مربوط به آخر هفته در نظر می‌گیریم.

بقیه ستون‌ها از نوع داده‌‌ی «عددی» هستن. ستون‌های دما و بارندگی از نوع اعداد «پیوسته» و ستون‌های آگهی و فروش از نوع اعداد «گسسته» هستن. وقتی می‌گیم عدد فروش از نوع گسسته است، یعنی تعداد فروش نمی‌تونه مثلا ده تا و نیم باشه، یا ده تاست یا یازده تا.

اما ستون قیمت داستانش یه مقدار متفاوته. با وجود اینکه از نظر مفهومی نوع داده‌ی عددیش از نوع پیوسته است، اما اگه به مقادیر نگاه کنیم می‌بینیم که تعداد مشخصی قیمت در ردیف‌ها ذکر شده: 0.30 و 0.50. بنابراین قیمت رو هم از نوع داده‌ی گسسته در نظر می‌گیریم. 

یکی از معمول‌ترین عملیات روی داده‌ها، «مرتب‌سازی» هستش. بر اساس اینکه داده‌ها بر چه مبنایی مرتب میشن،‌ میشه اطلاعات متفاوتی استخراج کرد.

مثلا وقتی داده‌های بالا رو بر اساس میزان فروش مرتب کنیم (ستون Sales)، تعیین اینکه کمترین و بیشترین فروش در چه دمایی بوده خیلی ‌سریع و راحت انجام میشهداده‌ها میتونن به صورت «صعودی» (سمت چپ) یا «نزولی» (سمت راست) مرتب بشن:

 

 

حالا اگه داده‌ها رو بر اساس ستون آگهی‌ها (Flyers) به صورت نزولی مرتب کنیم، به یه مورد تقریبا غیرعادی در داده‌ها می‌رسیم. بیشترین تعداد برگه‌ی آگهی که تو یه روز پخش شده 99 تاست که با تعداد بعد از خودش، یعنی 33 تفاوت فاحشی داره:

 

ممکنه رُزی یه روز اتفاقا تعداد زیادی برگه‌ی آگهی پخش کرده باشه. یا یه اشتباه تایپی باشه، مثلا به جای 19 نوشته 99. ما نمی‌دونیم کدومشون بوده، اما خوبه که موقع تجزیه و تحلیل بدونیم که همچین داده‌ی غیرعادی‌ای اینجا داریم. 

غیر از مرتب‌سازی، «فیلتر» فیلدها هم اطلاعات مفیدی به ما میده. مثلا برای بررسی فروش در روزهایی که دمای هوا کمتر از ۳۰ درجه بوده، می‌تونیم ستون Temperature رو با اعداد کوچکتر از ۳۰ فیلتر کنیم.

 

گاهی برحسب نیاز میشه «فیلدهای جدید»ی بر اساس فیلدهای موجود اضافه کرد. مثلا فیلد درآمد (Revenue) رو میشه با ضرب فیلدهای قیمت (Price) و تعداد فروش (Sales) اضافه کرد. همچنین با جمع مقادیر یه فیلد، مثلا درآمد، میشه به «داده‌ی جدید»ی مثل درآمد کل رسید:

 

 

نکته‌ی قابل ذکر دیگه اینه که وقتی حجم داده‌ها کمه، شاید بشه با یه نگاه چشمی داده‌ها رو با هم مقایسه کرد. اما وقتی تعداد ردیف‌ها زیاد شد، مقایسه‌ی داده‌ها کار سختی میشه. این‌طور مواقع میشه از روش‌هایی برای ساده‌سازی کار استفاده کرد. 

یه روش استفاده از رنگ هستش. مثلا تو ستون دما، دماهای بالاتر رو میشه پر رنگ‌تر نشون داد. یا مثلا بر اساس شرط خاصی، از رنگ‌های مختلفی استفاده کرد. به فرض تو ستون درآمد، ۲۵ درصد از بالاترین درآمدها  با رنگ سبز و ۲۵ درصد از پایین‌ترین درآمدها با رنگ قرمز نشون داده بشه. حتی از نمودار میله‌ای هم برای مقایسه‌ی داده‌ها میشه استفاده کرد. به فرض در ستون میزان بارش، بارش بیشتر دارای میله‌ی بلندتری خواهد بود:

 

 

به عنوان یه مثال، تو تصویر بالا میشه خیلی سریع و راحت متوجه شد که پایین‌ترین درآمد تو روزایی بوده که بیشترین بارندگی رو داشتن.

بخش سوم - نصویرسازی از داده‌ها و تحلیل آنها

 

۰ نظر
فربد صالحی