स्टॅटिस्टिक्स - हा शब्द उच्चारला की लोकांच्या मनात वेगवेगळ्या प्रतिमा निर्माण होतात. बऱ्याच लोकांना सर्वात प्रथम मनात येतं ते 'देअर आर लाइज, देअर आर अटर लाईज अँड देन देअर इज स्टॅटिस्टिक्स', 'स्टॅटिस्टिक्स हे बिकिनीसारखं आहे, बरंच काही दाखवतं, पण महत्त्वाचं तेवढं झाकून ठेवतं'वगैरेसारखे क्लिशे. हे अर्थातच दुर्दैवाचं आहे. कारण योग्य पद्धतीने वापरलं तर स्टॅटिस्टिक्स खोटं बोलत नाही. ते वापरून माणसं खोटं बोलतात, अंतिम सत्य सांगितल्याचा आव आणून. आपल्या स्वार्थासाठी खोटं बोलून त्याला शास्त्राचा आधार आहे असं दाखवणारी माणसं असतात, हे सर्वांनाच ठाऊक आहे. पण त्यात स्टॅटिस्टिक्सचा दोष कसा काय? म्हणजे अणूबॉंब तयार करून हिरोशिमा-नागासाकीची अपरिमित हानी करण्याबद्दल भौतिकशास्त्राला जबाबदार धरण्यासारखं वाटतं. आणि बिकिनीबाबत बोलायचं तर स्टॅटिस्टिक्समुळे सत्याने पांघरलेला बुरखा फाडून निदान ते बिकिनीपर्यंत तरी अनावृत्त होतं हे कुठेच गेलं...
स्टॅटिस्टिक्स शब्दाच्या इतरही काही अर्थछटा आहेत. एकेकाळी व्हायटल स्टॅटिस्टिक्स नावाचा प्रकार असायचा. वेगवेगळ्या नट्यांची, मॉडेल्सची मापं ३६-२४-३६ वगैरे स्वरूपात लिहिणं. पोलिटिकल करेक्टनेसच्या लाटेमध्ये बहुधा ते मागे पडलं असावं. निवडणुकांच्या वेळी स्टॅटिस्टिक्सचा प्रचंड पूर येतो. ट्रेंड, जनमत पोल, स्विंग व्होट्स, प्रेडिक्शन्स वगैरे शब्दांचा मारा होतो. कधीकधी ठार चुकीचे निष्कर्ष काढून हे पोलिटिकल पंडित देखील स्टॅटिस्टिक्सला बदनाम करतात.
एकंदरीतच सध्या अस्तित्वात असलेल्या विद्यानुसार भविष्याबाबत निष्कर्ष काढण्यासाठी स्टॅटिस्टिक्सचा वापर होतो. ''आत्ता' वरून उद्याची विद्या' (पन इंटेंडेड) असा स्टॅटिस्टिक्सकडे बघण्याचा दृष्टिकोन असतो. तो अर्थातच पूर्णपणे चूक नाही. इतिहासावरून काही धडे घेता येतात, काही अटकळी बांधता येतात. सूर्य जर गेली शेकडो वर्षं पूर्वेकडे उगवत असेल तर उद्याही पूर्वेकडेच उगवेल असं अनुमान बांधता येतं. मात्र जोवर इतिहासाच्या घटनांचे नियम लक्षात येत नाहीत तोवर केवळ आत्तापर्यंतचा ट्रेंड बघून त्यावरून निष्कर्ष काढले तर ते साफ चुकीचे ठरू शकतात.
सप्टेंबर २००८. अमेरिकेत गेली काही वर्षं फुगत असलेला घरांच्या किमतींचा फुगा फुटला. आणि त्यांच्या किमतीच्या आधारे काढलेली कर्जं बुडित जायला लागली. त्या कर्जांवर बेतलेल्या सिक्युरिटीज मातीमोल ठरायला लागल्या. त्यांमध्ये गुंतवणुक करणाऱ्या आर्थिक संस्थांना हादरे बसायला लागले. अमेरिकन शेअर बाजार कोसळायला सुरूवात झाली. शेअर्सच्या किमतींची सरासरी दाखवणारा डाउ जोन्स इंडेक्स ४५ टक्क्यांनी आपटला. लाखो लोक बेघर झाले, दीड दोन कोटी लोकांच्या नोकऱ्या गेल्या.
हे सर्व होणार हे सांगता आलं असतं का? जर कोणी डाउ जोन्स इंडेक्स च्या चढत्या आलेखाकडे बघितलं तर आदल्या पन्नास वर्षांत तो साधारण आठ-नऊ टक्क्यांनी वाढलेला आहे. अधनंमधनं खाली जातो, पण वरही येतो. २००८ आधीची डाउ जोन्सची आकडेवारी बघितली तरी सहा महिन्यात तो ४५% नी आपटेल असं कोणीही भाकित करू शकलं नसतं.
तेव्हा निव्वळ आकडेवारीवरून ढोबळ भाकित करणं चुकीचं ठरू शकतं. उदाहरणार्थ 'गेले सहा महिने क्ष स्टॉक दरमहा एक टक्क्याने वाढतो आहे. तेव्हा पुढच्या महिन्यातही तो एक टक्क्याने वर जाईल' असं म्हणणं धोकादायक ठरू शकतं. ती कंपनी फायदेशीर ठरण्यासाठी त्यांची उत्पादनं चांगली आहेत का, त्यांना मागणी आहे का, त्या कंपनीला स्पर्धा किती आहे, कंपनीची मॅनेजमेंट कशी आहे, कंपनीला कर्ज आहे का या सर्व गोष्टींचा विचार करावा लागतो, निव्वळ बॉटम लाईनचा विचार पुरेसा होत नाही.(त्यातही मेख अशी आहे की कंपनीची मूलभूत माहितीदेखील आकडेवारीतूनच घ्यावी लागते. म्हणजे स्टॅटिस्टिक्सपासून सुटका नाही) हे सगळं चांगलं असेल, आणि खरोखरच तिच्या शेअरच्या वाढीचा दर दरमहा एक टक्का असला तरीही ती वाढ त्याच गतीने कायम होईल असं नाही. पुढच्या महिन्यात दोन टक्के खाली जाईल, नंतरच्या महिन्या चार टक्के वर, असं खांबावर चढणाऱ्या माकडासारखं वर खाली करत वर जाऊ शकेल. नक्की किती माहितीवरून नक्की किती पुढची भाकितं किती निश्चितपणे करता येतील हा कळीचा मुद्दा आहे.
क्रिकेटच्या बाबतीत देखील हेच लागू होतं. एखादा खेळाडू सरासरी ४० धावा करत असेल, तर याचा अर्थ असा होत नाही की तो पुढच्या इनिंगमध्ये बरोब्बर ४० धावा करून बाद होईल. काही वेळा तो शून्यावर बाद होईल, तर कधी सेंचुरी मारेल. हे माहीत असूनही अनेक वेळा 'सचिन तेंडुलकरने गेल्या सहा इनिंग्समध्ये सरासरी १७ ने धावा केल्या. त्याचा फॉर्म गेला आहे. त्याने आता लवकरच रिटायर व्हावं' अशी विधानं वाचतो. म्हणजे वाचायचो. साहेबांना एवढ्यात तरी काही बोलण्याची हिंमत होऊ नये असा जबरदस्त फॉर्म आहे. पण सांगायचा मुद्दा असा की फॉर्मात असणं किंवा नसणं, हे नेहेमीच्या कमीजास्त रन होण्याचा भाग आहे की खरोखरच त्या खेळाडूच्या कौशल्यात काही कमी जास्त होतंय हे कसं ठरवायचं? मुळात फॉर्म म्हणजे काय? किंवा चांगला बॅट्समन नक्की कसा ठरवावा? निव्वळ गेल्या काही इनिंग्जमधली धावसंख्या पाहून हे ठरवता येईल का? हाच विचार बोलर्सविषयी करता येईल का? किंवा त्याहीपलिकडे जाऊन क्रिकेटचे काही मूलभूत 'स्थिरांक' आहेत का? ते बदलत आहेत का?
या व अशा इतर प्रश्नांची उत्तरं शोधण्याचा या मालेत प्रयत्न आहे. विशिष्ट खेळाडूंकडे न बघता संपूर्ण खेळाकडे बघण्याचा उद्देश आहे. विश्वचषक स्पर्धा चालू असल्यामुळे मी फक्त वन डे इंटरनॅशनल खेळांकडे बघणार आहे. त्यामुळे मी 'क्रिकेट'विषयी चर्चा करत असलो तरी विशिष्ट आकडेवारी केवळ त्याच फॉर्मॅटला लागू आहेत. आशा अशी आहे की मांडलेला दृष्टिकोन इतर फॉर्मॅटनाही लागू होईल, फक्त आकडे बदलतील. शक्यतोवर तांत्रिक शब्द न वापरता चर्चा करण्याचा विचार आहे. आकडेवारीमध्येदेखील तीन दशांश स्थळांपर्यंत अचूक उत्तर काढण्यापेक्षा सोपी, साधारण ठोकताळ्याची गणितं करण्याकडे माझा कल राहील.
जाताजाता एक प्रश्न. या विश्वचषकात एकोणपन्नास चुरशी होणार आहेत. तर या एकोणपन्नासांपैकी बरोब्बर एक मॅच टाय होण्याची शक्यता किती? बरोब्बर दोन मॅच टाय होण्याची शक्यता किती? हे उत्तर तुम्ही कसं काढलंत?
प्रतिक्रिया
20 Feb 2011 - 7:04 am | आनंदयात्री
क्रिकेटच्या मॅचचे खालीलपैकी एका फलित असू शकते.
१. अ टिम जिंकली
२. ब टिम जिंकली
३. टाय झाली
४. रद्द झाली (पाउसपाणी, मारामार्या ईटीसी)
मग एक मॅच टाय होण्याची प्रोबॅबिलिटी १/४ निघते. पण असे वाटते आपल्याला या प्रॉबॅबिलिटीत काही इंटरेस्ट नाही.
गृहितक: मॅचचे उत्तर टाय झाली किंवा टाय झाली नाही या दोन पैकी एक असु शकते.
नंबर ऑफ मॅचेसः ४९
शक्यता १:
टायः १
टाय झाली नाही : ४८
प्रोबॅबिलिटी: १/४९
शक्यता २:
टायः २
टाय झाली नाही : ४८
प्रोबॅबिलिटी: २/४९
(चुकले तर ढक्कल पास करा मालक ;) )
-
(ढक्कलपास विंजेनेर)
आंद्या नापास
20 Feb 2011 - 10:49 am | धनंजय
ख त र ना क !
गुर्जी शैक्षणिक फायदा घेतील इतपत भरपूर मालमसाला दिलेला आहे.
20 Feb 2011 - 11:14 am | विजुभाऊ
स्टेटॅटीक्स सिद्ध करू शकते की तुम्ही ५०% प्रेगनन्ट असू शकता
20 Feb 2011 - 11:52 am | क्लिंटन
जरी कोणत्याही सामन्याचा अ टिम जिंकली, ब टिम जिंकली, टाय आणि मॅच रद्द झाली या चार पैकी एक निकाल लागत असला तरी कोणताही सामना टाय व्हायची शक्यता १/४ नाही हे दिसतेच.तेव्हा हे चार सरफेस असलेला एक "फासा" आहे अशी कल्पना केली तर तो फासा "unbiased" नक्कीच नाही.आणि बहुतांश सामन्यांचे निकाल लागतात आणि टाय सामने फारच थोडे (बहुदा २% पेक्षा कमी) असतात हे लक्षात घेता तो फासा "unbiased" नाही हे लक्षात येईल.तेव्हा कोणताही सामना टाय व्हायची probability किती हे काढायला हवे.ते काढणार कसे हा कळीचा मुद्दा आहे.फायनान्समध्ये अशा कोणत्याही गोष्टीची probability काढायची असेल तर सर्वसाधारणपणे पुढील मार्ग असतात तेच मार्ग इथे उपयोगी होतात का ते बघू या:
१. जर का यापूर्वीच्या सामन्यांच्या विदामध्ये सर्व प्रकारच्या शक्यतांचा (हवामान, पिचची स्थिती आणि इतर अनेक घटक) यांचा समावेश झाला असेल आणि यापूर्वी खेळल्या गेलेल्या सामन्यांमध्ये किती सामने टाय झाले हे बघून मग कोणताही सामना टाय व्हायची probability काढावी. म्हणजेच सामन्याच्या निकालावर परिणाम करणारे समजा १५ (कदाचित जास्तही) घटक असतील (या घटकांमध्ये हवामान,पिच याबरोबरच एखाद्या संघाचे ढिसाळ क्षेत्ररक्षण,काही चांगल्या खेळाडूंचे अपयश इत्यादी अनेक गोष्टींचा समावेश असेल) आणि यापूर्वी झालेल्या सर्व एकदिवसीय सामन्यांमध्ये त्या १५ घटकांचा समावेश होऊन आपले sample space पुरेसे मोठे असेल तर या मार्गाने उत्तर काढता येईल.
पण क्रिकइन्फोवरून समजते की काल खेळला गेलेला भारत विरूध्द बांगलादेश हा ३१०० वा एकदिवसीय सामना होता.तेव्हा ३१०० हे sample space या उदाहरणातील गुंतागुंत लक्षात घेता पुरेसे आहे असे वाटत नाही.१९९६ च्या विश्वचषकात दुबळ्या केनियाकडून पराभूत होणाऱ्या वेस्ट इंडिजच्या संघाने नंतर त्या स्पर्धेत त्यापूर्वी अपराजित राहिलेल्या दक्षिण आफ्रिकेचा उपांत्यपूर्व फेरीत पराभव केला पण पुढे त्याच संघाने उपांत्य सामन्यात ऑस्ट्रेलियाविरूध्द विजयश्रीच्या जबड्यातून पराभव खेचून आणला!! अशी अनेक उदाहरणे देता येऊ शकतील.या सर्व गोष्टींसाठी अनेक वेगवेगळे घटक कारणीभूत असतील. तेव्हा या सगळ्या अनेकविध घटकांचा interplay एकाच वेळी होऊन आपल्याला वापरता येईल इतका मोठा विदा आपल्याकडे नाही असे म्हणता येईल.
म्हणजेच ही historic data पध्दत उपयोगी पडणार नाही.
२. कोणत्याही सामन्याच्या निकालावर परिणाम करणाऱ्या १५/२०/२५ किंवा जितके असतील तितके घटक ओळखावेत आणि या घटकांची वेगवेगळी किंमत घेऊन Computer simulations करावीत.उदाहरणार्थ स्टिव वॉचा हर्शेल गिब्जने झेल सोडला हा त्या सामन्याच्या निकालावर परिणाम करणारा घटक होताच.असे एखाद्या खेळाडूने करणे, किंवा सचिन तेंडुलकरसारख्या एखाद्या खेळाडूने ० ते २०० (कदाचित २५० सुध्दा) धावा काढणे इत्यादी इत्यादी अनेकविध घटक आहेत त्यांना computer simulation करून वेगवेगळ्या किंमती द्याव्यात आणि संगणकावर सामने simulate करावेत.असे अनेक सामने simulate करून त्यापैकी किती सामने टाय होतात ते बघावे. या प्रकाराला Monte Carlo Simulations म्हणतात. फायनान्समध्ये एकावेळी ५ किंवा फारतर १० घटकांचा निकालावर परिणाम होईल असे असताना Monte Carlo Simulations करताना एक मिलियन simulations करणे ही गोष्ट फारशी आश्चर्यकारक नाही.तेव्हा इथे बरेच जास्त घटक निकालावर परिणाम करत आहेत तेव्हा त्यापेक्षा जास्त (कदाचित १०० मिलियन सुध्दा) simulations करून त्यापैकी किती सामने टाय होतात हे बघावे आणि त्यावरून कोणताही सामना टाय व्हायची probability किती हे बघावे. यातही समजा काही घटक आपण विचारात घेतले नाहीत तर मात्र आपले उत्तर चुकेल.
एकदा हे सगळे उपद्व्याप करून एखादा सामना टाय व्हायची शक्यता किती (समजा ती शक्यता P असेल) हे कळले की मग पुढचा भाग सोपा आहे. मग binomial distribution वापरून आपल्याला प्रश्नाची उत्तरे कळू शकतील.
म्हणजे बरोब्बर १ सामना टाय व्हायची शक्यता: ४९ C १ गुणिले P गुणिले (१-P) चा ४८ वा घात
आणि बरोब्बर २ सामने टाय व्हायची शक्यता: ४९ C २ गुणिले P चा वर्ग गुणिले (१-P) चा ४७ वा घात
पण या सगळ्यात कळीचा मुद्दा आहे P ची किंमत किती हा!!
20 Feb 2011 - 4:23 pm | रमताराम
बहुतेक मुद्यांशी सहमत.
तो फासा "unbiased" नाही हे लक्षात येईल.
+१००. आपल्या आयुष्यात बहुतेक समस्या 'इक्वि-प्रोबेबल' शक्यतांनी बनलेल्या असत नाही, व्यवहारातील फासा बहुधा बायस्डच असतो. अन-बायस्ड फासा अथवा इक्वि-प्रोबेबल इवेन्ट्स ही संख्याशास्त्राची निव्वळ सुरवात आहे. संख्याशास्त्राच्या आमच्या अभ्यासक्रमात आम्ही लवकरच त्यांना विसरून जातो.
विदा वापरून काढलेली प्रोबॅबिलिटी ही तेव्हाच वॅलिड मानता येते जेव्हा जमा केलेला विदाची परिस्थिती नि आजची परिस्थिती जवळजवळ तीच असते. उदा. तुमचे महिन्याचे सरासरी वीजबिल १०० रू असेल नि या महिन्याचे १५० रू आले तर यात बदललेल्या वीज टॅरिफचा सहभाग असू शकतो. मागच्या आठ महिन्यांची सरासरी काढली असेल नि त्यासाठी पावसाळ्याचे नि हिवाळ्याचे आठ महिन्यांचा विदा वापरून आलेला निष्कर्ष उन्हाळ्याच्या चार महिन्यात कसा चुकतो हे दाखवणे हे संख्याशास्त्राची मर्यादा नव्हे तर असा निष्कर्ष काढणार्याचे अज्ञान दाखवते.
कोणताही निष्कर्ष काढताना जमवलेला विदा हा करावयाच्या अभ्यासावरून काय असावा (त्यातले आकडे नव्हे, कोणकोणती मोजमापे करावीत), कुठला विदा आवश्यक आहे, कोणते घटक अधिक परिणामकारक असतील, कोणते दुय्यम असतील, इतर अनेक न मोजलेल्या घटकांमुळे जास्तीतजास्त किती 'संभाव्य एरर' असू शकेल, ती 'एरर' जर फार अधिक असेल तर त्या दुय्यम समजलेला कोणता/ते घटक दखलपात्र घरून त्यांच्याशी संबंधित विदा जमा करणे आवश्यक आहे हे तपासणे इ. अनेक टप्पे यात येतात. पुन्हा निवडलेले घटक हे 'प्रत्यक्ष परिणाम' करणारे घटक आहेत की अप्रत्यक्ष परिणाम करणारे यावरून त्यांना अभ्यासात नक्की कसे स्थान द्यायचे हे ठरते. उदा. एखाद्या परफॉर्मन्सबाबत स्पर्धक स्त्री आहे की पुरूष हे महत्त्वाचे ठरत असेल तर तिथे त्या निकषावर स्वतंत्र गट करून अभ्यास केला जातो तर त्यांचे वय हा जर परिणाम करणारा घटक असेल तो कोवेरिएट अर्थात सरल घटक म्हणून वापरला जातो. हे सारे सारे लक्षात घ्यावे लागते. उचलला विदा नि काढला निष्कर्ष इतके सरळ असत नाही.
हे मात्र खरे कि विविध माध्यमातून केलेले सर्वे नि त्यातून काढलेले निष्कर्ष बहुधा असेच अनभिज्ञ लोकांनी काढलेले असतात. सध्या क्रिकेटबद्दल बोलतोय म्हणून एक प्रसिद्ध नि अनेकांचे लाडके उदाहरण घेतो.
सचिन तेंडुलकर हा देशासाठी खेळत नाही, किंवा तो खेळतो तेव्हा आपण हरतो असे एक ऑस्ट्रेलियन प्रॉपगंडाला बळी पडलेले आपले देशी लोक करत असतात. आणखी हेच लोक असे म्हणतात की जेव्हा संघाला गरज असते वा महत्त्वाच्या सामन्यात तो खेळत नाही. (दोन्ही तर्क एकत्र केले तर आपण महत्त्वाचे सामने नेहमीच जिंकतो असा एक मजेदार तर्क देता येईल, पण ते जाऊ दे.) तसा मी सचिनची सर्व शतके केलेल्या सामन्यात भारताची यशाची टक्केवारी सत्तर टक्क्याहुन अधिक आहे हे दाखवून दिले आहे. पण आता आमचेच खरे म्हटल्यावर मग 'स्टॅटिस्टिक्स/नंबर्स डोन्ट टेल एवरिथिंग' हे आणखी अडाणी समर्थन दिले जाते. पण ते असो. तर सांगायचा एक मुद्दा हा की एका विद्वानांनी वरील समज 'संख्याशास्त्राच्या सहाय्याने सिद्ध' केल्याचा दावा केला होता नि त्यांचे हे तथाकथित 'संशोधन' एका प्रसिद्ध इंग्रजी वृत्तपत्राच्या पहिल्या पानावर प्रसिद्ध झाले होते. उत्सुकतेने मी वाचले नि ह. ह. पु. वा. इथे कळीचा मुद्दा असा होता की 'संघाला गरज होती तेव्हा...' आता संघाला गरज असलेले सामने विदा म्हणून एकत्र करायचे तर ती गरज डिफाईन करायला हवी ना.
आता इथेच तर गंमत आहे. साहेबांनी 'भारत पराभूत झालेले' सामेन 'संघाला गरज असलेले सामने म्हणून विचारात घेतले होते. वरवर पाहता बरोबर वाटते ना? पण गंमत म्हणजे सचिनने भारताला गरज असताना तारले आहे असे सामने या विदामधे मुळातच येत नाहीत, आहे की नाही गंमत. आता भारत पराभूत झाला असेल तर त्या सचिनसारखा महत्त्वाचा मोहरा चालला नाही म्हणूनच हे सहज समजण्यासारखेच आहे की, त्याला संख्याशास्त्र कशाला हवे. थोडक्यात विदाच सोयीचा निवडला. पण निष्कर्ष मात्र विदा ज्याचा निवडला तेवढ्यापुरता मर्यादित न ठेवता 'जनरालाईज' केला, हे अज्ञान किंवा खोटारडेपणा यापैकी काहीही असू शकेल. गंमत म्हणजे यावर भारत जिंकलेले सामने जमा केले तर तिथेही तो बहुतेक वेळा यशस्वी झालेला दिसून येईल, म्हणून सचिन खेळतो तेव्हाच भारत जिंकतो असा निष्कर्ष काढता येऊ शकतो (जो तितकाच चुकीचा आहे). यावर तपशीलवार प्रतिसाद मी त्या वृत्तपत्राला पाठवला, जो अर्थातच त्यांनी छापला नाही. (आपण असले मूर्ख 'संशोधन' तेही देशाचा यूथ आयकॉन असलेल्या सचिनबद्दल - प्रसिद्ध केले हा आपलाच गाढवपणा ते कशाला कबूल करतील.)
असो .इतके पुरे. बाकीचे आगामी मालिकेत लिहू.
(संख्याशास्त्री)रमताराम
20 Feb 2011 - 7:52 pm | राजेश घासकडवी
उत्तर काढण्याची पद्धत अचूक आहे.
तुम्ही मॉंटे कार्लो सिम्युलेशनमध्ये जितक्या बारीकसारीक गोष्टींचा विचार न करता आपल्याला काही मॉडेल तयार करता येतं का, व त्यावरून ही P ची किंमत काढता येतं का हे पहाण्याचा या लेखमालेचा प्रयत्न आहे.
हे मात्र पटलं नाही. ३१०० निरीक्षणं एखादं वितरण निश्चित करायला पुरेसे असावेत. टाय होऊ शकतील असे काही सामने एक टीम जिंकते तर काही दुसरी. पण दुसऱ्यांदा बॅटिंग करणारी टीम किती रननी मॅच जिंकली किंवा हरली याचंही शून्याभोवती वितरण असेलच ना. त्या वितरणाचा अंदाज आपल्याला काही सोप्या गृहितकांवरून करता आला तर ती गृहितकं व्हॅलिडेट करता येतील. (याला मर्यादा आहेत, पण त्यांचाही विचार करू.)
20 Feb 2011 - 8:49 pm | क्लिंटन
असे सोपे मॉडेल तयार करता आले तर फारच उत्तम. त्यासाठी शुभेच्छा.
21 Feb 2011 - 3:36 pm | धनंजय
"p" काढण्यासाठी ऐतिहासिक आत्त पुरेसे नाही, याबद्दल क्लिंटनशी सहमत.
सिद्धांत शक्य तितका जास्तीतजास्त सोपा असावा, पण त्याहून सोपा असू नये.
आणि खर्याखुर्या क्रिकेटशी संबंध सुटेल इतके सुलभीकरण असू नये.
विकिपेडियावर या दुव्यावर पुढील परिच्छेद वाचला :
त्यामुळे ऐतिहासिक आत्तावरून इतकेच कळते, की "p"चे सोपे गणित केले तर कुठलेही उत्तर खर्याखुर्या क्रिकेटशी संबंधित राहाणार नाही.
(शेवटचे प्रश्न खेळकर विनोद आहेत असे मला वाटले होते. क्रिकेटमधील वेगळा कुठला प्रश्न स्टॅटिस्टिक्सच्या वर्णनासाठी घ्यावा ही श्री. घासकडवी यांना माझी विनंती. शाळेमधील गणितांत स्थिर बाजारभाव, न-बदलणारे व्याजदर... वगैरे अशी उदाहरणे घेतात. जेणेकरून सुलभीकृत गणितांची फलिते त्या सोप्या उदाहरणांत खरोखर लागू होतात. क्रिकेटमधील असेल कुठले उदाहरण घ्यावे.)
22 Feb 2011 - 12:41 am | राजेश घासकडवी
तुम्ही दिलेल्या उदाहरणात 'पहिल्या टायसाठी तब्बल १३ वर्ष' व त्यानंतर 'दुसऱ्यासाठी अजून ५ वर्षं' हे थोडं दिशाभूल करणारं आहे. १९७१ साली जेव्हा एक दिवसीय सामने सुरू झाले तेव्हा वर्षाला वीसेक सामनेच होत. त्यामुळे टाय होण्याची दर मॅचमागे शक्यता तितकीच असली तरी काळ खूपच जास्त जात असे. पहिली टाय व्हायला २४७ वा सामना उजाडला. दर शंभरात ०.७४% शक्यता असेल तर हा आकडा आश्चर्यकारक नाही. तसंच पहिल्या सातशे खेळांत ४ सामने टाय झाले. तेसुद्धा ३१०० मध्ये २३ शी विसंगत नाही.
टाय होण्याची शक्यता ही एक दिवसीय क्रिकेटच्या अधिक मूलभूत गुणधर्मांवरून काढता आली तर उत्तम.
20 Feb 2011 - 1:05 pm | भडकमकर मास्तर
क्रिकेट आवडते म्हणून वाचायला घेतले...
लेख भारी आहे...
त्यावरील चर्चा त्याहून भारी....
समजून घ्यायचा यथामति प्रयत्न करत आहे...
सीझन बॉल आपल्या शिवणीचा झुर्र असा आवाज करत डोक्यावरून निघून जातो त्याची आठवण झाली...
20 Feb 2011 - 2:01 pm | सहज
क्रिकेट आवडते म्हणून धागा उघडला बघतो तर काय? ज्यांची हयात कायम लिंबूटिंबू प्लेयर म्हणून गेली (असणार) अश्या लोकांचे गुफ्तगू चालले आहे.
चालू द्या.
20 Feb 2011 - 3:33 pm | रमताराम
कारण योग्य पद्धतीने वापरलं तर स्टॅटिस्टिक्स खोटं बोलत नाही. ते वापरून माणसं खोटं बोलतात, अंतिम सत्य सांगितल्याचा आव आणून. आपल्या स्वार्थासाठी खोटं बोलून त्याला शास्त्राचा आधार आहे असं दाखवणारी माणसं असतात, हे सर्वांनाच ठाऊक आहे. पण त्यात स्टॅटिस्टिक्सचा दोष कसा काय?
याबद्दल घासकडवी साहेबांना आमच्याकडून ब्लेजर, १०१/- रू रोख नि श्रीफळ देण्यात येत आहे. अर्थात आम्ही फक्त फटू टाकण्यावर कटवणार नाही. ्पुढील कट्ट्याला (आम्हाला निमंत्रण मिळाल्यास) प्रत्यक्ष भेटीत त्यांचा सत्कार (मूळ अर्थाने) करण्यात येईल.
बाकी स्टॅटिस्टिक्सला शिव्या देणारे वा टर उडवणारे कोणत्याही पुराव्याशिवाय -किंवा ढीगभर विरोधी पुरावा असूनही - दृष्टीआडच्या सृष्टीवर मात्र १००% टक्के विश्वास ठेवतात ही गंमत आम्ही रोज अनुभवतो. असो.
आमच्या प्रस्तावित संख्याशास्त्र ओळख मालिकेमधे संख्याशास्त्रावरील आक्षेपांचा यथोचित समाचार घेतला जाईल असे जाहीर करतो. (केव्हा लिहिणार असे खरडीतून विचारू नये, अपमान होईल... व्य. नि. वा इमेल मधून विचारले तरीसुद्धा!)
21 Feb 2011 - 9:56 am | ३_१४ विक्षिप्त अदिती
कार्यबाहुल्यामुळे रुमाल टाकत आहे. वेळ मिळाला की मैदानात उतरून प्रतिसाद देतेच. तोपर्यंत ही फक्त पोच.
21 Feb 2011 - 1:44 pm | निखिल देशपांडे
आज वर एकुण ३१०२ एकदिवसीय सामने खेळण्यात आले आहेत. त्यात फक्त २० सामने हे टाय अवस्थेत संपले आहे. आणि त्या प्रत्येक सामन्याचा नं ह्या दुव्यावर उपल्बध आहे. पहिला टाय झालेल्या सामन्याचा क्रमांक २४७ होता व दुसरा टाय झालेला सामना ५६७ तिसरा ६९०... अशी सिक्वेन्स काढुन पुढच्या टाय होणार्या मॅच चा नं सुचवता येईल का??? म्हणजे या सिक्वेन्सचा आणि वरच्या प्रॉबॅब्लिटी गणिताचे एकत्रीकरण करुन काही उत्तर निघु शकते का???
21 Feb 2011 - 3:29 pm | छोटा डॉन
बापरे !!!
चक्क फिक्सिंग ???
बाकी वर चालु असलेली आकडेवारी, ठोकताळे आणि इतर सांख्यिकी मजेशीर आहे असे सांगतो.
अवांतर :
परवा काय झालं माहित आहे का, मँचेश्टर युनायटेडचा 'वेन रुनी' आपलं उगाच येड्यासारखं धावत होता डी-च्या जस्ट आलीकडुन, अचानक त्याला बॉल थोडासा त्याच्याकडे येताना दिसला, बॉ किंचित उंचीवर आणि त्याच्याहुन दुर असा तिरक्य दिशेने चालला होता, ह्या पठ्ठ्याने १ सेकंदात ( किंवा त्या पेक्षा कमी ) झट्टदिशी कोलांटी उडी मारुन लाथेने बॉल जाळ्यात ढकलला आणि मॅन्-युने मॅच जिंकली.
काढा आता आकडेवारी आणि तत्सम :)
- छोटा डॉन
21 Feb 2011 - 3:44 pm | नितिन थत्ते
डकवर्थ आणि लुईस या दोन संख्याशास्त्रज्ञांनी कमी वेळ झालेल्या सामन्याचा निकाल लावण्याची पद्धत काढली आहे आणि ती वापरली जात आहे. त्या पद्धतीविषयी बहुतेक क्रिकेट समालोचक नाखूष आहेत.
त्या पद्धतीने काढलेले निष्कर्ष चुकतात. (म्हणजे क्रिकेटच्या खर्यास्वरूपाशी ते साधर्म्य राखत नाहीत-सोप्या शब्दात - दोघांना क्रिकेटमधलं काही कळत नाही.) आणि कधीकधी ते अन्यायकारक दिसतात. (१९९२ चा विष्वचषकातील द आफ्रिका आणि इंग्लंड यांच्यातला सामना).
त्यावरही प्रकाश टाकावा अशी अपेक्षा.
21 Feb 2011 - 6:48 pm | रमताराम
त्या पद्धतीने काढलेले निष्कर्ष चुकतात.
मुळात हा निष्कर्ष तुम्ही कसा काढलात ते सांगा अगोदर.
आमच्या मते डकवर्थ-लुईस ही पद्धत अतिशय उत्तम आहे. त्या दोघांनी क्रिकेट या खेळाचा नि एकुण शक्यतांचा जितका बारकाईने अभ्यास केला आहे तेवढा खुद्द खेळाडूंनी अथवा त्यांच्या कोचनेही कधी केला नसेल. विचारांचे नि तर्काचे, चिकाटीचे एकुणच वावडे असल्याने त्यातील गुंतागुंत बहुतेकांना समजत नसल्याने ती चुकीची आहे असे म्हणणे बहुतेकांच्या दृष्टीने सोयीचे असते इतकेच.
ता.क. १९९२ च्या सामन्यात (तोच ज्या १ चेंडूत २२ धावांचे हास्यास्पद गणित काढेल होते तोच म्हणताय ना?) डकवर्थ्-लुईस नियम अस्तित्वात आलेला नव्हता. तेव्हा ओवर कमी करताना पहिल्या डावातील सर्वात कमी धावा केलेल्या ओवर्स चढत्या क्रमाने काढून टाकल्या जात. इंग्लंडच्या डावात दोन मेडन ओवर्स पडल्याने द. आफ्रिकेच्या टार्गेटमधून दोन ओवर्स कमी झाल्या पण धावांचे टार्गेट तेच राहिले होते. किंबहुना या सामन्यानंतरच एखाद्या अधिक चांगल्या नियमाचा शोध सुरू झाला नि डकवर्थ्-लुईस नियम अस्तित्त्वात आला.
21 Feb 2011 - 7:08 pm | नितिन थत्ते
१९९२ विश्वचषकाबाबतच्या दुरुस्ती साठी धन्यवाद.
ड-लु नियमाची नक्की डिटेल्स माहिती नाहीत. वाचलेल्या माहितीनुसार संपलेल्या ओव्हर आणि गेलेल्या विकेट यानुसार किती धावा व्हायला हव्या याचे गणित केले जाते असे वाटते. (तुम्हाला नियम माहिती असेल तर माहिती द्यावी).
संपलेल्या ओव्हर नुसार टार्गेट काढणे म्हणजे क्रिकेटच्या डावात समान गतीने धावा होतात असे गृहीत धरणे आहे. तसेच गेलेल्या विकेटप्रमाणे टारगेट काढणे म्हणजे शेवटाचे फलंदाज जास्त धावा काढू शकतात हे नाकारणे आहे.
वरील लॉजिकमध्ये चूक असेल तर सांगावे.
मला आत्ता नक्की आठवत नाही पण २००३ च्या विश्वचषकाचा अंतिम सामना हरण्यामागे डकवर्थ लुईस नियमाचा (उलटा) हात होता असे काहीसे वाचल्याचे आठवते. पाऊस पडण्याची शक्यता आहे आणि ड-लु लागू होईल म्हणून भारताने ड-लु टार्गेटवर लक्ष ठेवून जरुरीपेक्षा वेगाने धावा काढायचा प्रयत्न केला आणि त्यात विकेट्स घालवल्या. नंतर मात्र सामना पूर्णवेळ चालला असे स्पष्टीकरण ऐकल्याचे आठवते.
21 Feb 2011 - 9:56 pm | रमताराम
संपलेल्या ओव्हर नुसार टार्गेट काढणे म्हणजे क्रिकेटच्या डावात समान गतीने धावा होतात असे गृहीत धरणे आहे. तसेच गेलेल्या विकेटप्रमाणे टारगेट काढणे म्हणजे शेवटाचे फलंदाज जास्त धावा काढू शकतात हे नाकारणे आहे.
दोन्ही गृहितके चुकीची आहेत असा माझा समज आहे. संपलेल्या ओवर्सनुसार टार्गेट काढत असले तरी याचा अर्थ समान गतीने धावा होतात असे मुळीच नाही. एकेक षटक संपल्यानंतर काढलेले टार्गेट एकाच गतीने वाढत नाही! त्रैराशिकाचा नियम इथे लागू पडत नाही. अशीच गोष्ट विकेट्सची आहे. मूळ गोष्ट अशी आहे की अनेक निकष लक्षात घेतले जातात, निव्वळ धावगती नि विकेट्स नव्हेत.
संपूर्ण नियम सांगणे शक्यच नाही (एकाहुन अधिक धाग्यांचा निबंध होईल तो) गुगलून मिळेलच. फक्त काही घटक सांगतो.
पहिला डाव अपूर्ण असताना पाऊस आल्यास वाया गेलेल्या वेळानुसार षटके कमी होतात. पण एवढेच नव्हे तर प्रत्यक्षात डाव संपल्यावर जेवढ्या धावा होतात त्यापेक्षा अधिक टार्गेट दिले जाते. हा एक नियम बहुधा सर्वांनाच जाचक वाटतो. या मागचा तर्क असा आहे की फलंदाजी करणार्या संघाने ५० षटकांचा प्लान बनवलेला असतो अचानक मधेच काही षटके वाय गेल्याने तो बदलावा लागतो. यात काही तोटे असे, १. पाचहून कमी षटके शिल्लक राहिली नि बॅटिंग पॉवरप्ले अजून घेतलेला नसेल (पूर्ण खेळात शेवटची पाच षटके घ्यावीत असे ठरवून) तर फलंदाजी करणार्या संघाला तो तोटा होतो. २. एखाद्या गोलंदाजाने आधीच दहा षटके टाकून घेतली असतील पण जर सरासरीनुसार प्रत्येक गोलंदाजाला मिळणारी षटके जर कमी झाली (समजा ८) तर आधीच टाकून झालेली षटके हिशोबातून काढून टाकता येत नाहीत. आता हा जर डेल स्टेन सारखा भरात असलेला गोलंदाज असेल तर गोलंदाजी करणार्या संघाला मोठा फायदाच म्हणायचा. हे आणि यासारख्या अनेक शक्यता ध्यानात घेऊन हे नियम बनवले आहेत. त्यातील गुंतागुंत सगळी समजून आली नाही तर अन्याय्य वाटणे सहज शक्य आहे.
अधिक माहितीसाठी या दुक्कलीचे हे संस्थळच पहा.
22 Feb 2011 - 3:29 pm | विजुभाऊ
रमताराम हे एक उदाहरण पहा
भारत इंग्लंड २००८ चौथ्या वन डे मॅच मध्य पहिल्या डावात पावसाने दोनदा व्यत्य आणला भारताने सामना २२ ओव्हर्स चा ठेवण्यात आला. भारताए २२ ओव्हर्स मध्ये भारताने चार बाद १६४ धावा केल्या. डकवर्थ लुईस निइयमानुसार इंग्लंडला २२ ओव्हर्स मध्ये १९८ धावांचे टारगेट ठेवण्यात आले.
इंग्लंद ने २२ ओव्हर्स मध्ये ८ बाद १७८ धावा केल्या . भारत१९ धावानी जिंकला
याचेच दुसरे उदाहरण
या वर्षी जानेवारीत दक्षीण अफ्रीकेत खेळण्यात आलेल्या वन डे त पावसाचा व्यत्य येवून सामना ४६ ओव्हर्स चा ठरवला गेला.
दक्षीण अफ्रीकेने ९ बाद २५० धावा केल्या.डकवर्थ लुईस नियमानुसार भारताला २६८ धावांचे टारगेट देण्यात आले. भारत ३३ ओव्हर्स मध्ये सर्व बाद २३४ झाले दक्षीण अफ्रीका ३३ धावानी जिंकली