Ahogy a kutatási kérdőívemre való felkérésben is megfogalmaztam, ennek kutatásnak kritikus fontosságú pontja, hogy minél többen töltsék ki a kérdőívet. Miért lényeges ez ennyire? Erre többféle válasz adható:
- Azért, hogy kutatásból születendő cikkeket neves folyóiratok leközöljék, szükséges egy nagyobb mintaelemszámon végrehajtott kutatás. Lényeges, hogy az eredmények hasonló nemzetközi kutatásokkal összehasonlíthatóak legyenek, ehhez pedig jó lenne elérni egy 400-500-as mintaelemszámot.
- Ez a kutatás kvantitatív jellegű kutatás. Magas mintaelemszám esetén megbízható regressziós- és logisztikai regressziós modell állítható fel, ahol lehetséges a kereszt-ellenőrzés is. Mit is jelent ez pontosan: egy 500 elemű válaszadói minta estén lehetséges annak az eljárásának a követése, hogy a mintát két része osztom: egyik legyen 420 elemű, a másik 80 elemű részminta. A 420 elemű mintán (nevezzük tanuló-adatbázisnak) deduktív módszerrel felállítok egy statisztikai modellt, és modellek tulajdonosságát ellenőrzőm a 80 elemű mintán. És ha 80 elemű mintán futtatott modell hasonló tulajdonságokkal rendelkezik (hasonlóan erős modell képét adja), akkor ez az eredmény sokkal hitelesebb, mintha “csak” felállítottam volna egy modellt. (Ha “csak” felállítok egy modellt, és nem kerül sor az ellenőrzésre, akkor fennáll a “túltanítás” veszélye, azaz a modell az eredeti adatokra “jól viselkedik”, de bármilyen új adatra téves eredményt adhat. A visszaellenőrzés pont ezt a jelenséget küszöböli ki.)
- Magasabb mintaelemszám esetén lehetséges adatbányászati eljárásokon alapuló csoportokat képzeni. Ennek során az adatok mintázata alapján matematikai, illetve statisztikai eljárások alapján csoportokat képzünk (esetleg olyan összefüggések alapján, amely “szabad szemmel” nem láthatóak). Ennek az eljárásnak eredményeképpen új és korábban nem várt kutatási eredményekhez juthatunk.
- Lehetséges a regionális szintű iparági elemzés.