slide1 l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Kombinatorikus robbanás (összes szabály feltárása) nélkül létezhet-e üzleti evolúció? Történetek és kifeje PowerPoint Presentation
Download Presentation
Kombinatorikus robbanás (összes szabály feltárása) nélkül létezhet-e üzleti evolúció? Történetek és kifeje

Loading in 2 Seconds...

play fullscreen
1 / 25

Kombinatorikus robbanás (összes szabály feltárása) nélkül létezhet-e üzleti evolúció? Történetek és kifeje - PowerPoint PPT Presentation


  • 302 Views
  • Uploaded on

Kombinatorikus robbanás (összes szabály feltárása) nélkül létezhet-e üzleti evolúció? Történetek és kifejezések kombinálása nélkül léteznének-e viccek?. Ősrobbanás nélkül létezne-e biológiai evolúció?. Domján Csaba, 2009-2010. Az adatbányászati siker úgy születik, mint egy jó vicc.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Kombinatorikus robbanás (összes szabály feltárása) nélkül létezhet-e üzleti evolúció? Történetek és kifeje' - binah


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

Kombinatorikus robbanás (összes szabály feltárása) nélkül létezhet-e üzleti evolúció?Történetek és kifejezések kombinálása nélkül léteznének-e viccek?

Ősrobbanás nélkül létezne-e biológiai evolúció?

Domján Csaba, 2009-2010

slide2

Az adatbányászati siker úgy születik, mint egy jó vicc

Mindezek miatt újszerű módon, a viccek logikáján keresztül mutatom be az adatbányászatot a prezentáció további részében

slide3

A béres elújságolja a feleségének, hogy egy nagyon finom süteményt kóstolt az úri kastélyban. A felesége megígéri, hogy megsüti otthon számára, ha haza tudja hozni a receptjét. A férj megszerzi a pontos leírást, a feleség elkezdi olvasni:

Végy 10 tojást. - Nekünk nincs 10 tojásunk, kettővel fogom csinálni

Adj hozzá 100 gramm cukrot. - Nekünk nincs cukrunk, ezt ki fogom hagyni.

100 gramm csokoládét keverjünk el … - Nekünk nincs csokink, így kakaóval fogom helyettesíteni.

1 kg lisztet …

Amikor a sütemény elkészül, a feleség megkóstolja és megjegyzi:

Nem értem, hogy mit szeretnek ezen annyira a gazdagok.

Amazon.com az összes forgalmazott terméke közötti vásárlási magatartásszabályt feltárja és minden online keresésnél a plusz, személyre-szabott ajánlatokat megjeleníti, - növelve az eladási rátát. Sokan ismerik a „receptet”, de

„Elég lesz az összes termék helyett néhány terméket megvizsgálni”

„Nincs szükség 3-4-5-6 dimenzióban összefüggéseket keresni, elég ha SQL-ben összeszámoljuk a gyakoriságokat”

Majd a végén konstatálják:

Nem értjük, hogy az Amazon.com mitől olyan sikeres.

slide4

Egy fiatalember a városba költözik és beáll egy nagyáruházba eladónak.

- Van valami tapasztalata ezen a területen?- kérdezi a főnöke.

- Persze, én ne tudnék eladni ...

A menedzser gondolja, na majd meglátjuk, de tetszik neki a fiatalember önbizalma.

Az első nap után megkérdezi tőle:

- Na, hány vevője volt ma?

- Csak egy.

- Egy? A többi eladó átlaga napi 20-30! Mennyi volt a bevétele?

- 210 325,65 dollár.

- Mennyi???? Mit adott el?

- Először eladtam neki 1 pecahorgot. Aztán egy nagyobbat. A végén egy egész horgászfelszerelést. Aztán kérdeztem, hova akar horgászni menni?

Ő fel akart menni az északi partra. Erre azt tanácsoltam, hogy oda kell egy vitorlás is. Erre elmentünk az osztályra és vett egy duplamotoros Seawind-et. De nem volt biztos benne, hogy a Civic-je el tudja-e vontatni. Így lementünk a szalonba és eladtam neki egy Pajero-t 4WD kerékmeghajtással.

- Maga azt akarja mondani, hogy az az ember akart 1 horgot és maga a végén eladott neki egy hajót, meg egy autót?

- Hááát, nem egészen... Az úr egy csomag tamponért jött be .. .

Erre mondtam neki, ha már a hétvégéje így el van cseszve, elmehetne inkább horgászni...

Ez lenne az üzleti adatbányászat lényege, ennek ellenére cégek töredéke él a lehetőséggel! Pl. az Amazon.com teljesen hasonló kaptafára oldja meg az online, real-time ajánlatát minden (potenciális) ügyfelével szemben. A WizWhy a szabályokból minden helyzetre megtalálhatja a legjobb döntést (az adatbányászati módszerek többsége alkalmatlan erre). A WizWhy Predictor különösen és egyedülállóan támogatja ezt (újabb és újabb információnál azonnali döntés).

slide5

Egy gabonakereskedőnél a két beosztott egyike kevesebb bért kapott. Egy napon megkérdezte a főnökét az okról.

- Be fogom neked bizonyítani. A vásártérre társzekerek érkeztek. Nézz utána, hogy mivel terhelték meg azokat!

Az alkalmazott visszajött és jelentette:

- Kukoricával terhelték!

- Akkor nézz utána, hogy mennyi az a kukorica!

Az alkalmazott elsietett, majd visszatérve jelenti:

- Hatvan tonna.

- Most kérdezd meg, kinek a részére hozták?

- Berger Pinkas részére. - válaszolta újból visszatérve.

Hívatta a főnök a másik alkalmazottat is és kérte, hogy nézzen utána a társzekereknek. Az visszatérve mondta:

- A parasztok Jblonovból hatvan tonna kukoricát szállítottak Berger Pinkas részére. Én zsákonként öt fillérrel többet ajánlottam. A kukorica már a csűrben van.

Néhány nappal később a kereskedő felesége hirtelen megbetegedett. A rosszabb alkalmazottat küldték doktorért. Negyven perc múlva megjelent az orvos, a rabbi, a hitközség vezetője, a temető gondnok és négy zsidó a temetkezési egyesülettől a koporsóval.

Így bizonyította be, hogy ő is milyen rendkívül körültekintő lett.

Fenti automatizmus az adatbányászat, de általában egy-egy aspektusból megvizsgálják a témákat, azután próbálnak újabb irányt venni a látottak alapján, és így tovább … (vagy sok munkanapnyi energiával újból kell kezdeni az elemzést a zsákutca miatt). A WizWhy ellenben alapból feltár MINDEN ASPEKTUST.

slide6

A kis motoros repülő pilótája és a teherszállító-repülő vezetője vitatkozik egymással a repülési tudásról, majd együtt felszállnak. Elsőként a motoros repülős mutatja be a tudását, fordulók, dugóhúzó, … majd megjegyzi rádión:

Ezt csináld utánam!

Ezt követően a teherszállító repülő pilótáján a sor, a repülő hosszú perceken át megy egyenletesen, majd rádión átszól a másik pilótának:

Ezt csináld utánam!

De hát nem is csináltál semmit.

Dehogynem, elmentem a mosdóba, majd készítettem magamnak egy jó kávét

SQL programozással billentyűvirtuóz mutatványt lehet bemutatni, hogy előálljon valami eredmény egy-egy adatállomány kapcsán. Ellenben célszoftverrel (WizWhy adatbányászati szoftver) csupán 2 kattintás (SQL programozásban ezalatt a Select utasítás „Se” leírásig lehet eljutni) és a „robotpilóta átveszi a vezetést”, hogy kellemes kávézás után csak a kész eredményekre kelljen ránézni (amelyeket SQL-ben akár több éves munkával sem lehetne elérni módszertani korlátok miatt).

Az előző két téma (hajó-eladás, illetve a gabonakereskedő esete) kapcsán próbáljuk elképzelni, hogy SQL-ben hogyan lehetne megoldani a problémát, és máris érzékelhetővé válik az óriási különbség.

slide7

Két ismerős találkozik:

Képzeld, készítettem egy korszakalkotó újítást, egy borotválkozási automatát. Be kell dugni a fejet egy gépezetbe és megborotválja az arcunkat.

De hát minden embernek más és más a fejformája

Kezdetben csakugyan, …

Szinte minden cégnél vannak nagy kampányok, amelyek hasonlóan működnek (mindenkinek ugyanazt ajánlják az ügynökök, call centeresek, ügyintézők) és nem veszik figyelembe, hogy minden embernek más-más az igénye, ízlése. A professzionális adatbányászat szó szerint személyre szabott ajánlatot tud adni.

Néhányan beépítenek a rendszereikbe néhány „sarokszámot” és ha egy ügyfél eléri azt a szintet, akkor jelez. Ennek számtalan szakmai hibája közül három:

Nem igaz, hogy mindenkire ugyanaz a „küszöb” jellemző (életkor, nem, fizetési szint, stb., stb. alapján jelentős differenciák léteznek!)

Nem igaz, hogy pl. 100%, 200%, 300% értékek a legjobbak (ezeknek többnyire a kényelemhez, mintsem a valós eltérésekhez van köze).

Nem igaz, hogy „létezik egyképletes robotpilótaprogram”, azaz igényes módon azt kellene megvizsgálni, hogy mely más változókkal lehet a megbízhatóságot növelni.

A WizWhy ilyen hibák kiküszöbölésére alkalmas.

slide8

Egy fiatalember elmegy az urológiára.

- Doktor úr, nagyon szégyellem... de azt szeretném, ha kiherélnének.

- De hát uram, hogyan képzeli? Miért akarja ezt?

- Ne kérdezze, doktor úr, csak heréljen ki!

- Rendben, de ezt nem fizeti a tb, fizetnie kell százezer forintot!

- Fizetem, amit kell, csak heréljen ki!

Megtörténik a műtét, a beteg magához tér az altatásból. Orvos megkérdezi:

- Most már elmondja, miért heréltette ki magát?

- Egy zsidó lánynak udvarolok, és azt mondta, hogy csak akkor jön hozzám, ha kiheréltetem magam.

- Nem azt mondta az a lány, hogy metéltesse körül magát?

- Igaza van, doktor úr, ez a helyes kifejezés!

SQL nem adatbányászat. táblázatkészítés nem adatbányászat. Jóllehet sok cég szeretne megfelelni a külső elvárásoknak, de az adatbányászat definíciója a következő:

“The nontrivial extraction of implicit, previously unknown, and potentially useful information from data”

“...the process of employing one or more computer learning techniques to automatically analyze and extractknowledge from data contained within a database.”

slide9

Miért bolyongott Mózes 40 évet a sivatagban?

Hogy megtalálja azt az egyetlen helyet a Közel-Keleten, ahol nincs kőolaj.

A kőolajbányászat az egyik legnagyobb üzlet a világon.

Sokan arról álmodoznak, hogy a kertjükben feltör az olaj.

Cégek több helyen próbafúrásokat végeznek.

Néhány profi átszkennerezné a földkérget 3 dimenzióban, hogy megtalálják a legnagyobb olajlelőhelyeket. Mindenki beláthatja, hogy a legnagyobb olajmező pozícióinak a definiálása lenne a fő cél, nem pedig olyan eszköz, amely egy adott szélességi és hosszúsági fokhoz megmondaná, hogy található-e olaj vagy sem.

Az adatbányászat definíciója alapján könnyű belátni, hogy ha valaki próbafúrást végeztet az általa elgondolt helyen, akkor hiába a fúrófej találja meg az olajréteget, nem a fúrófej érdeme a siker, ellenben ha egy berendezés mondja meg az olaj várható helyét, akkor az csakugyan a használt módszer érdeme. Pl. az SQL nem figyelmeztet, hogy az elemző ne a 31-35, 36-40 életkorkategóriát használja, mert igazából csak 33-37-nél van a szignifikáns hatás és a „Group by Termék1, Termék5” esetén sem jelez, hogy a Termék1 mellett a Termék18-at kellene írni, mert ott van a legfontosabb összefüggés. Az adatbányászat képes felfedezni ezeket, - AUTOMATIKUSAN. Ettől adatbányászat!

Az „átszkennerezés igényessége” jellemző a professzionális adatbányászatra.

Példa: adott 3 tulajdonság : autó hengerűrtartalma (500-3000 ccm), irányítószámok (1011-9985), életkor (18-90)

A 2501 x 3200 x 73 egységet tartalmazó térben hol találhatók a legkevesebb kárt okozó ügyfelek? WizWhy automatikusan feltárná az 584.233.600 egységű elméleti térben, hogy pl. 1241-1485 ccm ÉS 5420-8520 ÉS 39-48 éves szegmens a legjobb.

slide10

Egy ember az utcai lámpa körül keres valamit. Egy járókelő megkérdezi:

- Valamit elvesztett?

- Igen, egy rubelt.

- Itt, a lámpánál?

- Nem, valamivel messzebb.

- Akkor miért itt keresi?

- Mert itt van elég világos!

Mindenki ismeri az adatbányászat legelterjedtebb definícióját (ismeretlen, rejtett tudás felfedezése), mégis abból indulnak ki sokan, hogy „az általam felsorolt tényezőket kell megvizsgálni, mert ezek függnek össze és azon belül is az alábbi értékeket …” és így értelemszerűen kimaradnak azok a variációk, amelyek csakugyan üzleti felfedezések alapját képezhetik.

Ezért ne csak a „világosban” keressük a siker – még meg nem talált - kulcsát! Ott mások korábbi érdeme miatt van világosság (homály).

Az adatbányászat éppen a fenti „ködszurkálós” hiba kivédésére is szolgál. Az igazi adatbányászat meg tudja állapítani a változók sorrendjét, illetve a változókon belül a releváns értékeket és MEG IS TUDJA MAGYARÁZNI AZ ÁLLÍTÁST. „Retorika helyett metodika kellene”

slide11

Én tiszta ember vagyok! Évente megfürdök, akár szükség van rá, akár nincs!

Különösen a pénzügyi válság miatt folyamatosan változik a gazdasági helyzet, így az esetek nagy részében önáltatás, hogy 1-2 hónapnál régebbi összefüggés-vizsgálat (modell) nem szorul felülvizsgálatra. Ezért van szükség olyan szoftverre, amely automatikusan képes szabályokat létrehozni. Akár naponta kell „tisztán tartani” a modelleket.

slide12

Matematika kapcsán háromféle embertípus létezik: aki tud számolni és aki nem.

Példa: egy (pénzügyi) cégnek 200 fiókja van országszerte, átlagosan 5 ember dolgozik egy fiókban (500 a központban) és éves szinten az ügyfelek 10%-a morzsolódik le, ugyanakkor ugyanennyit akvirálnak.

Kérdések:

Egy fióknak átlagban mennyi a hozzájárulása a cég volumenéhez?

Egy dolgozónak átlagban mennyi a hozzájárulása a cég volumenéhez?

Egy fióknak mennyi lehet a költsége (irodabérlés a város központjában, berendezés, rezsi, 5 munkabér, stb.)

Illetve

Ha egy adatbányász a churn esetek csupán 20%-át meg tudná menteni pontos előrejelzéssel, úgy a hozzájárulása hányszorosa lenne az átlagos fióki, illetve átlagos dolgozói értékhez képest (ha már adott a call center)?

Egy adatbányász költsége hányadrésze lenne egy fióki költségnek?

Mindezek ellenére a 201-edik, a 202-edik fiók szervezése miatt „nincs idő” foglalkozni adatbányászati megoldásokkal, vagy rendszerint „létszámkorlátot” emlegetnek a pályázóknak. Minden adatbányász egyben potenciális ügyfél is, ezért ilyenkor felmerül benne a kérdés, hogy „rábízzam-e a pénzem olyan cégre, amely ha tudna dupla hozamot elérni egy profi elemző által, akkor sem tehetné meg, mert a létszámkorlát miatt neki is nemet fognak mondani?!”

slide13

Kohn rajtakapja a feleségét a gyakornokkal. A haját tépi és ordít:

- Tudtam! Tudtam!

Mire Kohnné:

- Na ja, de ő most is tud!

Évtizedekkel ezelőtt sokan örültek annak, hogy nagy adatállományokat is elemezni lehetett pl. SQL által, de időközben olyan sokváltozós adattárházak jöttek létre, amelyeknél az SQL sokszor már használhatatlan. Senki sem vállalkozna rá, hogy egy áruház 30-40.000 termékét megvizsgálja SQL-ben minden aspektusból, hiszen szó szerint a Háború és béke c. könyv sorainál is több sorból állna a kód, amely még így is csak kezdetleges megoldást biztosítana Ezért rendszerint óriási kompromisszumok születnek (néhány terméket vizsgálnak csupán), vagy olyan szoftvert használnak, ahol a több ezer változó elemzése ugyanannyi emberi munkát igényel (WizWhy által), mint a néhány változós adatállományé.

slide14

Egy kereskedő panaszkodik az ismerősének:

- Csődbe jutottam.

- Honnan tudod?

- A folyószámlakönyveimből.

- Nu, miért nem égeted el őket?

Sok churn modellnél hasonlóan „hasznos” tanácsadás történik, amikor a már menthetetlen eseteket mutatja ki a modell (már több havi fizetési elmaradás van, telefonhívások száma minimális, egyenleg minimális, stb.). Az igazi adatbányászat (WizWhy különösen) képes a gyenge jeleket időben feltárni (azokat felerősíteni), ezáltal időben elkezdhető a prevenció.

slide15

Egy hajó megy a tengeren. Egyszerre olyan vihar támad, hogy a hajót végveszély fenyegeti. Egyik zsidó utas hangosan imádkozik:

- Hatalmas Isten, segíts meg ! A hajó elveszik, elmerülünk! Mentsd meg a hajót!

Megszólal a másik zsidó:

- Végtére is minek jajgatsz?! A te hajód?

Az adatbányász nemcsak alkalmazott, hanem az esetek legnagyobb részében ügyfél is. Például: ha rosszabb a keresztértékesítés, a churn, úgy nagyobb díjakkal kell neki is számolnia. Ugyanakkor tudja azt is, hogy hiába van jó modell, ha azt mellőzik a döntéshozók, úgy pl. a díjemelés - ügyfél szempontjából – nem méltányolható.

slide16

Kohn a vendéglőben:

- Főúr, adjon nekem abból a halból!

- Pardon, uram, ez sonka!

- Kérdeztem én, hogy minek hívják azt a halat?

Az adatbányászati munkák 99%-a nem adatbányászat, hanem táblakészítés, amely 10-20-30-40 évvel ezelőtti módszertani megoldásokkal készül. Több hasonlóságot találunk az ilyen táblázatok és a szocializmusban kiadott évkönyvek között, mint pl. az Amazon.com által használt adatbányászati outputokkal történő összevetésben.

Sok esetben a táblázatok többmilliós adatbányászati szoftverekkel, azon belül is azok SQL funkcióit használva állnak össze. Ez olyan mintha egy tehenészet építtetne egy automatizált fejőházat , de továbbra is kézzel fejnék a teheneket.

slide17

Elromlott az autó. Tulajdonosa egyik szerelőt a másik után hívta, de egyikük sem volt képes a hibát megszüntetni. Előkerült ekkor egy zsidó bádogos. Felemelte a motorháztetőt, ütött párat a kalapácsával és a kocsi újból ment.

- Mivel tartozom?

- Húsz koronával.

- De hát ezért a néhány ütésért?

- Uram, egy korona az ütés, tizenkilenc, hogy tudtam, hová kell ütni.

Sokan előnyben részesítenek ingyenes szoftvereket, de általuk nem szoktak felfedezést tenni (ingyenes receptek milliói találhatók az Interneten, de azokat a recepteket, amelyekkel üzleti siker érhető el (pl. Coca-Cola, Pick szalámi), soha nem osztják meg). A WizWhy szoftverben lévő tudás kerül „tizenkilenc koronába”, de az „autó újból menni fog”.

A logisztikus regresszió, a neurális háló előrejelzése olyan mintha egy autóban csak légzsák lenne (score)

A WizWhy nemcsak előrejelzést ad (légzsák, lásd score), de érthető szabályai segítenek a prevencióban is (fékek)

Többet ér egy olyan rendszer, amely nemcsak azt mutatja ki, hogy ki a rákos beteg, de az okokat is megnevezi. Ez triviális elv, mégis az adatbányász módszerek többsége csak 0-1 közötti score-t szolgáltat.

slide18

Stern dicsekszik a felesége szépségével. Félrevonja őt egy barátja, s megkérdezi:

- Valóban nem tudod, hogy a feleséged megcsal?

- Na és? Inkább vagyok benne egy jó dologban ötven százalékkal, mint százzal egy rosszban.

Minél többen használnak professzionális adatbányászati alkalmazást, annál fontosabb csatlakozni a népes táborukhoz, mintsem ragaszkodni a rossz gyakorlathoz.

Aki megtapasztalja, hogy milyen érzés egy gombnyomással :

tudni, hogy az összes változónak mi a fontossági sorrendje,

tudni, hogy az összes változón belül hol vannak a releváns határok,

tudni, hogy a releváns intervallumok közül melyek szignifikánsak és melyek nem,

tudni, hogy adott változóhoz az n-1 változó közül melyiket kell társítani, hogy a legnagyobb megbízhatóságbeli növekedés álljon elő (és így tovább),

tudni, hogy az ÖSSSZES SZABÁLY automatikusan feltárásra kerül, és csak tanulmányoznia kell azokat,

az soha többé nem akarja a régi rossz gyakorlatot követni. „Aki ismeri a másodfokú egyenlet megoldási lépéseit, az már nem számtalan próbálgatással akarja meghatározni az együtthatókat”.

slide19

Az unokatestvéremnek valóban rosszul megy! Ha nem lenne az a szokása, hogy hetenként két napot böjtöl, már bizonyára régóta éhezne.

3995 USD-ba kerülő WizWhy szoftver megvásárlásának az elutasításával nem takarékoskodni lehet egy-egy cégnek, hanem kizárni magát a profitteremtő lehetőségekből.

A pénzügyi válságban sokszor elhangzik a pénzügyi cégek önsajnáltatása (csökkenő bevételek, elforduló ügyfelek, stb.), és sokszor kritikusan (többször megvetően) beszélnek az ügyfelek affinitásáról. Csakugyan az embereknek kb. 5-10%-a nevezhető „kamatvadásznak” (kgfb témában az ügyfelek akár 50%-a a legjobb ajánlatot akarja), de ők egyéb munkájuk után(!) hasonlítanak össze ajánlatokat, míg a „kritikusok” munkaidőben(!) még ennyire sem foglalkoznak ajánlatokkal (több szakember véleménye szerint is). Egy költői kérdés: el tudnák képzelni, hogy céges vezetők legalább 50%-a egy churn projekt előtt felmenjen egy honlapra, ahol 14 churn-módszer van összehasonlítva, hogy a legjobbat tudják kiválasztani, hogy pl.a +5%ponttal jobb megoldás által százmilliókkal kedvezőbb legyen a cégnek, az ügyfeleknek. A kgfb-nél ez történik, - az ügyfelek részéről (lásd Netrisk.hu, Biztositas.hu, stb.). Az első céges kivétel bizonyára igen látványos eredményekkel válik majd ismertté.

slide20

Megkérdezik a rabbit:

- Rabbi, tulajdonképpen hogyan keletkezik az eső?

- A felhők olyanok, mint a nagy nedves szivacsok. No mármost, ha ezek a szélben egymásnak nyomódnak, akkor az olyan, mint amikor az ember a szivacsokat kinyomja: kijön a víz.

- Hogyan tudja bizonyítani, rabbi, hogy ez így van?

- Hát nem látod: esik!

Számtalan hasonló érvelést lehet hallani „adatbányászati” témában. Pl. egyszerű SQL lekérdezés által kiderítik, hogy a csekkes befizetésű embereknél nagyobb a lemorzsolódás, - ezért megbüntetik az ilyen befizetőket ÁLTALÁNOSAN, azt remélve, hogy így p.o. áttérnek csoportos beszedésre. Pedig számos alszegmens található, ahol a csekkes befizetésűek is jó fizető ügyfelek, így az általános büntetés miatt már lehet, hogy az is otthagyja a céget, aki korábban nem akarta (de nem azért, mert csekkes díjfizetést választott, hanem a cég díjnövelő rossz döntése miatt). Másik példa, amikor kiválasztanak egy célcsoportot, de nemcsak megkeresés történik, hanem valami túl extra ajánlattal kötik egybe, majd végeredményként kimutatják, hogy nagyon sikeres volt a célcsoport kiválasztása.

slide21

A később híressé vált rabbiról mesélik:

Amikor hétéves volt, a tanítója elküldte sörért. A gyermek pénzt kért, a tanító pedig tréfából így szólt:

- Pénzért hozni nem művészet, pénz nélkül hozni művészet.

A fiú elment, nemsokára visszajött és átnyújtott a tanítójának egy üres korsót.

- Hol a sör? – kérdezte a tanító.

Erre a fiú:

- Tele korsóból inni nem művészet, üres korsóból inni művészet!

Feltárni az adatállományok összes szabályát szoftver nélkül „művészet” (lehetetlenség), ellenben a tényleges megvalósulásnak ára van (ha nem is sok).

slide22

Két zsidó megállapodik:

- Tehát holnap találkozunk?

- Igen!

- Hol?

- Ahol akarsz!

- És mikor?

- Nekem teljesen mindegy!

- Jó, de kérlek, légy pontos!

Adatbányászat első feladata a cél meghatározása, mégis sokszor elmarad vagy nem elégséges, ugyanakkor elvárják, hogy „pontos” legyen az eredmény. Például, egy biztosítónál churn modell lenne a cél, de nem határozzák meg, hogy milyen célból (akikkel már nem kell foglalkozni, vagy akiknek még lehet ajánlani megoldást, stb., stb.)

slide23

Az alperes a bíróság előtt áll, mert hamisított bort adott el, maga védekezik a törvényszék előtt:

- Bíró úr, ért ön valamennyit a kémiához?

- Nem, én jogász vagyok!

Majd a szakértőhöz fordul:

- Szakértő úr, ért ön valamennyit a joghoz?

- Nem, én kémikus vagyok!

- Látja, bíró úr, és ön megkövetelné egy szegény zsidótól, hogy mindkettőben kiismerje magát.

A WizWhy szoftver nagy előnye, hogy az adatbányásznak nem feltétlenül kell értenie a vizsgált területhez (pl. gyógyszeripar), mert

1) feltárja az összes szabályt (azaz nem az elemzőn múlik, hogy mit tár fel)

2) Az if-then szabályok érthető formában készülnek, tanulmányozható módon (így bármely egyéb szakember értelmezni tudja őket adatbányász nélkül is)

slide24

Két zsidó osztozkodik egy rabcellán. Az egyik sztoikus nyugalommal fekszik a priccsen. A másik idegesen rohangál fel-alá. Megszólal a priccsen fekvő:

- Mondd csak, miért rohangálsz? Azt hiszed, hogy ha mész, akkor már nem ülsz?

Sok programozással megoldható „adatbányászat” csakugyan egy „rohangálás”, miközben módszertani korlátok „börtönében” ül az elemző.

Óriási tévedés, hogy az adatbányászat csupán modellképzés és az azt megelőző lépéseknek a régről megszokott módon kell történnie (amire gondol az elemző, azt néhány aspektusból megnézi Excelben, és abból alapozza meg a modellépítést). A WizWhy MINDEN változót megvizsgál MINDEN ASPEKTUSBÓL teljesen automatikusan, tanulmányozható formában és abból lehet – egy gombnyomással – „összmodelles” score-t kérni régi vagy új rekordokra. A változok fontossági sorrendjének a felállítása, a releváns szakaszok, ill. a szignifikancia-szintek feltárása ugyanúgy az adatbányászat elválaszthatatlan része. A „régről megszokott módszerek” követőinél ezek nem kerülnek megállapításra.

slide25

A szakmai viccgyűjtemény második részét szívesen megküldjük e-mailben minden érdeklődőnek:

optimum.solution@yahoo.com

Köszönjük érdeklődését!