T.C.
SAĞLIK BAKANLIĞI
TÜRKİYE HALK SAĞLIĞI KURUMU
İSTATİSTİKSEL PAKET PROGRAMI ALIMI
TEKNİK ŞARTNAMESİ
İhale Konusu
Türkiye Halk Sağlığı Kurumu tarafından; gelişen analitik içeriğiyle, ileri düzey analiz yöntemlerinin
kolay kullanım özellikleriyle uygulanmasına, sonuçlara daha hızlı erişilip, sonuçlar üzerindeki
işlemlerin daha performanslı gerçekleştirilmesine ve bunların kurumsal ve bireysel yapıda dinamik
olarak paylaşılmasına olanak sağlayan istatistiksel paket programı alımı işidir.
Kapsamı
İstatistiksel paket programının kullanım amacına yönelik olarak üç farklı yapıda alınmasına ihtiyaç
vardır. Bu sayede farklı kaynaklardan verilere erişim, erişilen verilerin kolayca analize hazırlanması,
son derece geniş bir yelpazede istatistiki analiz yöntemi, raporlama ve grafiksel analiz olanağı
sağlaması amaçlanmaktadır.
2.
TANIMLAR VE KISALTMALAR
Bakanlık: Sağlık Bakanlığı,
İdare/Kurum/AIıcı: Türkiye Halk Sağlığı Kurumu,
Başkanlık: İstatistik ve Bilgi İşlem Daire Başkanlığı,
Program: İstatistiksel Paket Programı
İstekli: Mal veya hizmet alımları ile yapım işlerinin ihalesine teklif veren tedarikçi, hizmet
sunucusu veya yapım müteahhidi,
Yüklenici: Üzerine ihale yapılan ve sözleşme imzalanan istekli
3.
TALEP EDİLEN PAKET PROGRAM VE MİKTAR
PAKET
Tipi İstatistiksel Paket Program
Tip2 İstatistiksel Paket Program
Tip3 İstatistiksel Paket Program
KULLANICI
1
7
20
4. İSTATİSTİKSEL ANALİZ ÇÖZÜMÜ - ÖZELLİKLER
A. VERİYE ERİŞİM VE VERİ YÖNETİMİ
*
Farklı kaynaklardaki veriye erişebilmeli (Excel, Oracle, SQLServer, Access, dBASE, text,
SYSTAT, SAS, Stata, SPSS gibi) ve veriyi formatım değiştirmeden ana veri kaynağından
analiz edebilmelidir.
*
Verileri farklı veri kaynakları halinde (Excel, CSV, text, SAS, Stata, Database, SPSS gibi)
saklayabilmelidir.
*
Verinin yeniden yapılandırılmasına yönelik uzmanlık isteyen işlemlerde kullanıcıyı
yönlendiren ve işlemleri kolaylaştıran bir yapı içermelidir.
*
Bir kerede birden fazla oturum açma özelliği, oturumlar arasında kopyalama ve yapıştırma
işlemlerini yapabilme özelliği olmalıdır.
*
Text formatmdaki verilerin okunma işlemlerinde, kullanıcıya zaman kazandıran ve
kullanıcıyı yönlendiren bir yapı içermelidir.
*
ODBC bağlantısı olan bütün veri tabanları ile text verilerine erişebilmeli, erişilen veriyi
verinin formatım değiştirmeden kullanabilmelidir. ODBC soru sihirbazı ile veri tabanındaki
birden fazla tablo üzerinden istenen verileri görüntüleyebilmeli, analiz edebilmeli ve ODBC
desteği olan veri tabanlarına veri aktarabilmedir.
*
Tarih ve zaman verileri ile daha rahat çalışabilme imkanı sağlayan tarih ve zaman sihirbazı
içermeli.
*
Ürünün arayüzü kullanılarak; veri girişi, kayıt ve değişken kopyalama, kesme ve yapıştırma
işlemleri yapılabilmelidir.
*
Uzun değişken isimlerini kullanma ve çok uzun text kayıtlarını kullanma özelliğini
içermelidir.
*
Değişkenlerin
Özelliklerini
tanımlama
ve
değişkenler
için
kişisel
bilgi
sözlüğü
yaratabilmelidir.
*
Analiz öncesinde değişkenlerin ölçüm seviyeleri (kategorik, sürekli) bir ara yüz üzerinden
otomatik olarak belirlenebilmelidir.
*
Değişkenleri, grafik üzerinden kategorilere ayrılabilmelidir.
*
Bir değişkenin bilgilerini diğer bir değişkene veya bir veri setindeki bilgileri diğer bir veri
setine kolaylıkla kopyalayabilmelidir. Veri değişimi ile ilgili olarak "sıralama", "filtreleme",
"seçme", "hesaplama", "kodlama", "yeniden kodlama", "değişkenleri kategorize etme",
"otomatik kodlama", “çift kayıtları tespit”, “visual binning” özelliklerine sahip olmalıdır.
*
Kolay kullanılan syntax arayüzüne sahip olmalıdır. Otomatik tamamlama, syntax’m renkli
kodlaması, satır numaralarım gösteren bir alan, kesim noktası olan bir Syntax Editor
içermelidir. Bu özellik ile daha kolay ve daha hızlı syntax oluşturmaya yardımcı olmalı ve
kodu çalıştırmadan önce hataları kontrol etmeye sağlamalıdır. Hataları önceden yakalamanın
yanında syntax editöründeki eklemeler hem analiz hem de rapor dağıtımını oldukça etkili
kullanılmasını sağlamalıdır.
* Var olan diyalog pencereleri kolay anlaşılır hale getirilebilmeli ve programlama boyunca
kullanıcı tanımlı özel diyalog pencereleri oluşturabilmesine imkan sağlamalıdır.
* Ürün gerektiğinde, client-server ve stand-alone mimariyi desteklemelidir ve kullanıcının
mimariyi seçme şansı olmalıdır.
B. İSTATİSTİKSEL PAKET PROGRAMLARININ TEKNİK ÖZELLİKLERİ
B l. Tipi İstatistiksel Paket Program Teknik Özellikleri
* Verinin ön analizinde kullanılan; Tanımlayıcı Oran İstatistikler (Descriptive Ratio Statistics
(PVA)),
Çapraz Tablolama (Crosstabs),
Keşifsel Analizler (Explore),
Tanımlayıcı
İstatistikler (Descriptive Statistics), Frekans Tablosu ve Veri Özetlemesi (Summarize Data)
işlemlerini yapabilmelidir.
* Bağımlı T-testi, iki bağımsız grubu karşılaştıran T-testi ve ikiden fazla bağımsız grubun
karşılaştırmasında kullanılan Tek Yönlü Varyans Analizini (ANOVA) yapabilmelidir.
* Korelasyon ve kısmi korelasyon işlemlerini yapabilmelidir.
* Kümeleme Analizlerini yapabilmeli. K-Means ve Hiyerarşik kümeleme analizlerini
yapabilmeli ve kategorik ve sürekli verilerde ve büyük veri setlerinde îki Aşamalı Kümeleme
Tekniğini (Two-Step Cluster) kullanmalıdır.
* Parametrik olmayan testleri (Non - Parametric Tests) içermelidir.
* Discriminant Analizi, Doğrusal ve Ordinal Regresyon Analizleri, Eğri Kestirme
(Curve
Estimation), Faktör Analizi, Çok Boyutlu Ölçekleme (ALSCAL Multidimensional Scaling),
Güvenilirlik (Reliability) ve En Yakın Komşu (Nearest Neighbor Analysis) analizlerini
yapabilmelidir.
* Pearson Ki-kare testi, Likelihood ratio test, Fisher’s exact test, Linear-by-linear association
test, Contingency coefficient, Phi, Cramer’s V, Goodman ve Kruskal Tau, Uncertainty
coefficient, Kappa, Gamma, Marginal homogeneity test, Jonckheere-Terpstra test, Wilcoxon
signed-rank test, Cochran's Q test, Binomial test gibi analizleri yapabilmelidir.
h
*
Monte Carlo Simulasyon tekniği ile simulasyon yapılabilmelidir.
o Kurulan
modellerin
doğruluğunu
ve
başarısını
geliştirmek
adına
modelin
oluşturulduğu veri setinde yer alan alanlara uygun dağılımlar fit edilerek, her alan için
sentetik veriler simule edilebilmelidir,
o Herhangi bir model geliştirmeye ihtiyaç duymadan var olan veri setlerinde yer alan
sayısal ya da sayısal olmayan alanlara uygun dağılımlar fit edilerek her alan için
sentetik veriler simule edilebilmelidir.
Sayısal hedef alanların tahmin edilmesinde Automatic Linear Model (ALM) algoritması ile
otomatik biçimde güçlü ve güvenilir doğrusal modeller oluşturabilmelidir.
*
Generalized Estimating Equations (GEE), General Linear Models (GLM), Generalized
Linear Mixed Models (GLMM), Generalized Linear Models (GZLM), Tekrarlı ölçümler için
GLM (GLM Repeated Measures) analizlerini yapabilmelidir.
*
Variance Component Analizi, Kovaryans Analizi (Covariance Analysis (ANCOVA)), Çok
Değişkenli Varyans Analizi (Multivariate Variance Analysis (MANOVA)) ve Çok değişkenli
Kovaryans Analizini (Multivariate Covariance Analysis (MANCOVA)) yapabilmelidir.
General LogLinear Analizi, Logit LogLinear Analizi, Sağkalım Analizi (Survival Analysis),
Kaplan-Meier Sağkalım Analizi, Yaşam Tabloları (Life Tables) ve Cox Regresyon (Cox
Regression), analizlerini yapabilmelidir.
*
Lojistik Regresyon, Multinomial Lojistik Regresyon, Probit Analizi, Doğrusal Olmayan
Regresyon, Ağırlık Tahmini (Weight Estimation), İki Aşamalı En küçük Kareler Regresyon
analizlerini yapabilmelidir.
*
Kategorik Regresyon (Categorical Regression) , Kategorik T emel Bileşenler Analizi
(Categorical Principal Component Analysis) , Doğrusal Olmayan Kanonik Korelasyon
Analizi (Nonlinear Canonical Correlation Analysis), Uygunluk Analizi (Correspondence
Analysis), Çoklu Uygunluk Analizi, Çok Boyutlu Ölçekleme (Multidimensional Scaling)
yapabilmelidir.
Küçük ömeklemler üzerinde Pearson Ki Kare testi, Linear-by-linear association testi,
Contingency coefficient istatistiği, Uncertainty coefficient istatistiği—simetrik ya da
asimetrik, Wilcoxon Îşaret-Sıra testi,
Cochran's Q testi ve Binom testi gibi prosedürler
uygulandığında veri ilgili varsayımları karşılamıyorsa daha güvenilir ve kesin bir önemlilik
seviyesi (significance
level) elde etmeyi sağlayan Exact, Monte Carlo metotlarını
içermelidir.
4
Karar Ağaçları algoritmalarından CHAID, Exhaustive CHAID, C&RT, QUEST algoritmaları
kullanılarak analiz yapılabilmelidir.
> Karar ağacı algoritmaları ile geliştirilen modellerin genelleştirilebilir olup olmadığım
doğrulama adına Validation metotları kullanılabilmelidir. Cross validation ve splitsample validation metotlarını içermelidir.
> Geliştirilecek ağacın derinliği algoritma tarafından otomatik olarak belirlenebilmelidir
ya da kullanıcı tarafından tanımlanabilmelidir,
> Karar ağacı modelleri tarafından oluşturulacak kuralları sağlayacak minimum kayıt
sayısı kullanıcı tarafından belirlenebilmelidir.
> Geliştirilen
modelin
aşırı
öğrenme
sorununu
engelleyebilmek
için budama
yapılabilmelidir.
> Yanlış
sınıflandırma
maliyetleri
tanımlanarak
karar
ağacı
modelleri
geliştirilebilme! idir.
> Kategorik hedef alanların populasyondakİ kategori dağılımlarını belirtmek amacıyla
önsel olasılıklar tanımlanarak karar ağacı modelleri geliştİrilebilmelidir.
> Kategorik hedef alanların her kategorisi için gelir-gider değerleri atanarak modelin
geliştirdiği tahminler sonucunda kazanç tablosu oluşturulabilmelidir.
Sinir Ağları modellerini içermeli, Multilayer Perceptron (MLP) ve Raidal Basis Function
(RBF) algoritmalarını desteklemelidir.
Aşağıdaki analizler için Bootstrapping yaklaşımını içermelidir;
■ Frekanslar
■ Tanımlayıcı İstatistikler (Descriptive Statistics)
■ Keşifsel analizler (Explore)
■ Çapraz Tablolar (Crosstabs)
■ Ortalamalar (Means)
■ Tek Ömeklem T-Testi (One Sample T-Test)
*
Bağımsız Ömeklemler T Testi (Independent Samples T Test)
■ Bağımlı Ömeklemler T Testi (Paired Samples T Test)
■ Tek Yönlü Varyans Analizi (One Way ANOVA)
■ GLM Univariate
■ İki Değişkenli Korelasyon (Bivariate)
■ Kısmi Korelasyon (Partial)
■ Doğrusal Regresyon (Linear Regression)
5
■ Ordinal Regresyon
■ Discriminant Analizi
■ GLM Multivariate
*
Cox Regresyonu
*
Linear Mixed Models
■ Binary ve Multinomial Lojistik Regresyon
Zaman serileri analizine yönelik olarak;
■ Uzman model seçeneklerini kullanarak en iyi modeli otomatik olarak
önermelidir.
*
ARIMA modeli gerçekleştirebilmelidir.
■ ARIMA modeli uygulanırken kullanıcının sezonsal ve sezonsal olmayan
özbağlanım (autoregressive), hareketli ortalama (moving average) ve fark
(difference) değerlerini tanımlamasına izin vermelidir.
*
ARIMA modeli uygulanırken toplamsal (additive), geçici (transient), lokal
trend (local trend), düzey kaydırma (level shift), yenilikçi (innovational),
sezonsal toplamsal (seasonal additive) ve toplamsal ek (additive patch)
tipindeki uç değer yapılarını otomatik olarak belirleyebilmelidir.
■ ARIMA modeli uygulanırken kullanıcının belirli zaman değerlerini uç değer
olarak belirtmesine imkan tanımalıdır.
■ Üstel düzleştirme (exponential smoothing) modeli gerçekleştirebilmelidir.
*
Sezonsal olmayan üstel düzleştirme modellerinden basit (simple), Holt’un
linear trend’ini (Holt’s linear trend), Brown’m linear trendini (Brown’s linear
trend) ve sönümlü trend (damped trend) içermelidir ve kullanıcının istediği
model tipini seçmesine imkan tanımalıdır.
■ Sezonsal üstel düzleştirme modellerinden basit sezonsal (simple seasonal),
Winter’m toplamsal (Winter’s additive) ve Winter’in çarpımsal (Winter’s
multiplicative) içermelidir ve kullanıcının istediği model tipini seçmesine
imkan tanımalıdır.
■ Zaman serileri çıktılarında Stationary R Square, R Square, Root mean square
error, Mean absolute percentage error, Mean absolute error, Maximum
absolute percentage error, Maximum absolute error, Normalized BIC uyum
ölçü değerlerini ve Ljung-Box istatistiklerini vermelidir.
6
■ Zaman serileri çıktılarında modelleri karşılaştırmak için ACF (Residual
autocorrelation function), PACF (Residual partial autocorrelation function) ve
uyum iyi istatistiklerini vermelidir.
■ Zaman serileri çıktılarında her bir model için parametre tahminlerini, ACF
(Residual autocorrelation function), PACF (Residual partial autocorrelation
function) istatistiklerini vermelidir.
■ Zaman serileri çıktılarında yapılan tahminleri görüntüleyebilmelidir.
* Zaman serileri çıktılarında modelleri karşılaştırmak için Stationary R Square, R
Square, Root mean square error, Mean absolute percentage error, Mean
absolute error, Maximum absolute percentage error, Maximum absolute error,
Normalized BIC, ACF(Residual autocorrelation function), PACF (Residual
partial autocorrelation function) grafiklerini vermelidir.
"
Zaman serileri çıktılarında her bir model için seri, gözlenen değer, tahmin
edilen değer, ACF (Residual autocorrelation function), PACF (Residual partial
autocorrelation function), tahmin edilen değere ait güven aralığı grafiklerini
verebilmelidir.
* Zaman serileri çıktılarım Stationary R Square, R Square, Root mean square
error, Mean absolute percentage error, Mean absolute error, Maximum
absolute percentage error, Maximum absolute error, Normalized BIC uyum
iyiliği değerlerine göre fıltreleyebilmeli ve kullanıcının belirtti sayıda modele
ait sonucu görüntüleyebilmelidir.
■ Model gerçekleştirildikten sonra oluşan tahmin değerini, tahmin değerine ait
alt
ve
üst
sınırları,
model
artıklarım
değişken
olarak
veri
setine
ekleyebilmelidir.
■ Oluşturulan modeli XML formatmda kullanıcının belirttiği lokasyona
aktarabilmelidir.
■ Kullanıcı
kayıp
değerleri
geçerli
veya
boş
göze
olarak
çalışmaya
ekleyebilmelidir. Kullanıcı istediği opsiyonu seçebilmelidir.
■ Otomatik olarak sezonsal ayrıştırma(seasonal decomposition) yapabilmelidir.
Sezonsal ayrıştırma yapılırken kullanıcı toplamsal veya çarpımsal modelleri
isteğine göre kullanabilmelidir.
■ îzgesel (spectral) grafikler oluşturabilmelidir. Dönemsel çizitin (periodogram)
düzleştirilmesi için Tukey-Hamming, Tukey, Parzen, Bartlett ve Daniel
yöntemlerini içermelidir ve kullamcı istediği yöntemi seçebilmelidir.
■ Kullanıcının belirlediği değişkenlere göre dizisel grafikleri (sequence charts)
çİzebilmelidir. Kullanıcı birden fazla değişkene ait grafikleri eş zamanlı olarak
elde etmek isterse hem değişkenler için ayrı ayrı grafik oluşturma hem de aynı
grafik üzerinde birden fazla değişkeni inceleme seçeneği bulunmalıdır.
*
Kullanıcının belirlediği değişkenlere göre otokorelasyon(autocorrelations)
yapısı incelemelidir. Kullanıcı birden fazla değişkene ait otokorelasyon
yapışım eş zamanlı olarak elde etmek isterse değişkenler için ayrı ayrı grafik
oluşturmalıdır. Otokorelasyon yapışım incelenirken hem otokorelasyon hem de
kısmi otokorelasyon(partial autocorrelations) çıktıları üretmelidir.
■ Çapraz korelasyon (cross corelation) grafikleri üretebilmelidir.
Kayıp değerlerin nerede yer aldığı, ne kadar yaygın olduğu, rasgele görülüp görülmediği
gibi patemleri
tanımlayan,
Listwise, Pairwise, Regresyon veya EM
(Expectation
Maximization) gibi farklı metotlar ile ortalama, standart sapma, kovaryans, korelayon
tahminlerini yapan ve uygun yöntemlerle kayıp değerleri dolduran bir prosedür içermelidir.
*
Karmaşık örneklemler oluşturmada kullanılabilmeli, ömeklem oluşturmada Simple Random
Sampling, Simple Systematic, Simple Sequential, PPS, PPS Systematic, PPS Sequential, PPS
Brewer, PPS Murthy, PPS
Sampford metotlarım içermelidir.
Karmaşık ömeklem
tasarımlarını bir yardımcı ile birlikte oluşturabileme, oluşturulan karmaşık ömeklem
tasarımlarını kaydedebilme, düzenleyebilme ve yeniden açabilme özelliklerine sahip
olmalıdır.
Çözüm bileşenleri optimal örneklemler oluşturmak için etki boyutu, örnek genişliği, güç
derecesi, alpha düzeyi parametreleri düzenleyebilmelidir.
*
Çok boyutlu kategorik ve sayısal veri incelemesine olanak sağlamalıdır. Kategorik
değişkenler
ile
ilgili
(CORRESPONDENCE),
Categorical
regression
(CATREG),
Multiple
(MULTIPLECORRESPONDENCE),
Categorical
Correspondence
analysis
correspondence
analysis
principal
analysis
components
(CATPCA), Nonlinear canonical correlation analysis (OVERAL), Multidimensional scaling
analysis (PROXSCAL), Preference scaling (PREFSCAL) analizlerini yapabilmelidir.
Veri üzerinde bulunan bilgiden faydalanmak adına doğrudan pazarlama ile ilgili kompakt bir
menü içermeli, RFM analizi, kümeleme analizi, profillendirme analizlerini menü üzerinden
yapabilmedilir. Posta kodlarına göre profillendirme, hedef cevap eğilimleri, kontrol paketi
testi, oluşturuan modelin skorlanması özelliklerini içermeledir.
Ürün ve servis planlamasına yönelik süreçlerin belirlenmesinde, müşteriler için en uygun
ürünlerin ve ürünlerin özelliklerinin belirlenmesinde, ürün özelliklerinden hangilerinin
8
tüketicinin tercih seviyesinde ne derece önemli olduğunun test edilmesinde ve fiyatlandırma ve
marka değer çalışmalarının yapılmasında kullanılmak üzere Orthoplan Plancards ve Conjoint
analizlerini yapabilmelidir.
Gözlem sayısının yetersiz olduğu durumlarda yapılacak analizlerin daha doğru sonuç
vermesini sağlayacak aşağıdaki analiz yöntemlerini içermelidir:
■ Pearson Ki-kare Testi
*
Likelihood Ratio Test
■ Fisher’s Exact Test
■ Linear-by-linear association Test
■ Contingency Coefficient
■ Phi
■ Cramer’s V
■ Goodman ve Kruskal Tau
■ Uncertainty Coefficient
■ Kappa
■ Gamma
■ Marginal Homogeneity Test
■ Jonckheere-Terpstra Test
■ Wilcoxon Signed-Rank Test
■ Kruskal- Wallis Test
■ Johnckhere - Terpdra Test
■ Cochran’s Q Test
*
Binomial Test
■ Me Nemar Test
■ Mann Whitney Test
■ Kolmogrov Smirnov Test
■ Wald Wolfowitz Test
■ Friedman Test
*
Kendall’s W Test
*
Asymptotic Statistics ve Monte Carlo Tahminleri
Veri geçerliliğini kontrol aşamasında düz ve çapraz kural kümeleri oluşturabilmelidir. Analiz
öncesinde verinin manuel ve otomatik hazırlanmasını sağlayacak kolay bir ara yüze sahip
olmalıdır. Veri içerisindeki anormal kayıtların tespitini yapabilmelidir.
*
Komut dili ile kullanıcının kendi uygulamalarım geliştirmesine imkan vermelidir.
*
Otomasyon özelliğine sahip olmalı, aynı veri dosyası üzerinde sürekli yapılan analizler için
menü kişiselleştirilebilme!!, menüye çalışma adına yeni alt menüler ilave edilebilmeli ve
yüzlerce analiz tek bir tuş ile erişilebilir hale getirilebilmelidir.
*
Benzer analiz gruplarının otomatik olarak farklı veri yapılarına entegre edilmesini
sağlayabilmelidir.
*
Önceden oluşturulan ve XML formatında saklanabilen modellere bir ara yüz üzerinden
kolaylıkla erişilerek yeni gelen veriler skorlanabilmelidir.
*
R ve Phyton açık kaynak kodlarıyla entegre olabilmelidir.
Grafikler
*
İstatistiksel en az 50 değişik yüksek çözünürlüklü grafik üretimi ve bunları değişik resim
formatlarmda saklayabilme özelliği olmalıdır. Auto ve çapraz korelasyon grafikleri, interaktif
grafikler, Chart galerisi olmalıdır.
*
Üç boyutlu etkileşimli grafik alabilmeli, grafikleri interaktif olarak kullanabilmelidir.
*
Çoklu grafik oluşturma dili ile isteğe uyarlanmış grafikler elde edilebilmelidir
*
ROC analizleri yapabilmelidir.
*
Kategorik grafikler (bar, çizgi, alan, pasta, kutu çizimi vb); Serpme çizimler (Scatterplots:
Basit, gruplu, matrix, 3-D);
Yoğunluk çizimleri (popülasyon piramitleri, nokta çizimler,
histogramlar) olmalıdır
*
Kalite kontrol grafikleri (pareto, x-bar, yayılma alanı, sigma, bireysel grafik, hareket eden
aralık grafiği) içermelidir
*
Kalite kontrol uygulamalarında, ileri proses kontrol grafikleri ile analizleri yönetebilme ve
daha etkin olarak değişiklikleri izleyebilmeye imkan vermelidir.
*
Çoklu kullanım grafikleri (Çift Y eksenli ve overlay grafikler, 2 boyutlu çizgi grafikleri,
çoklu yanıt kümeleri için grafikler) içermelidir
*
Coğrafi haritalar üzerinde grafikler üretilebilmelidir. Ayııca ESRİ formatındaki harita
dosyalarının kullanılmasına olanak sağlamalıdır.
Çıktı:
*
Sonuçları HTML formatında export edebilmeli. Active X teknolojisine sahip olmalı, output
scripting özelliği olmalı, sonuçları word/excel/power point’e export edebilmelidir. Tabloları
grafiğe dönüştürebilmelidir. Draft Viewer, XML Formatında Smart Score’a Model İhraç
A
1
Etme, Pivot Tablolar / OLAP Küpleri,
Output yönetim sistemi, Yeni değişken editörü
penceresi, Sıra kayıtların sürekli olmayacak şekilde çoklu seçimi özelliklerine sahip
olmalıdır.
Birden çok değişkeni tek bir pivot tabloda gösterebilmek amacıyla stacking, nesting ve layers
yöntemlerini kullanabilmelidir.
Tek bir pivot tabloda bir değişkenin kategorilerine ilişkin ara toplamlar verilebilmelidir.
Pivot
tablo
üzerinde
değişkenin
diğer
kategorileri
kullanılarak
yeni
kategoriler
oluşturulabilmelidir.
Oluşturulan pivot tablolar, seçilen kategorik ve sayısal değişkenlere ilişkin özet istatistikleri
(satır yüzdesi, sütun yüzdesi, ortalama, mod, medyan, standart sapma gibi) İçermelidir.
Pivot tablo üzerinde, satır ve sütun alanlarına atanan değişkenlerin arasında ilişki olup
olmadığını test etmek amacıyla uygun olan 3 farklı test istatistiğinden birini verebilmelidir.
Çıktı dosyalar, “spv” formatmda kayıt edilebilmelidir.
Ek ürün ile çıktılar, internet ve intranet ortamında yaymlanabilmelidir.
Elde edilen analitik sonuçlar, çıktılar, grafikler, tablolar PDF, Word, Excel ve Power Point’e
aktarabilmelidir. Aynı zamanda sonuçlar web raporu olarak export edilebilmeli, program
arayüzünü açmaya ve smartreader gibi ek bir ihtiyaç duymadan farklı platformlarda ve akıllı
cihazlarda sonuçlar görüntülenebilmelidir.
Çıktılar üzerinde çeşitli değişiklikler yapılabilmelidir.
o Tablolar içerisindeki metinsel ifadeler ve sayıların yazı tipi, boyutu ve formatı
değiştirilebilmeli ve renklendirilebilmelidir. Tablonun genel formatı seçilen farklı bir
format ile değiştirilebilmelidir.
o Analitik sonuçları içeren tablolarda yer alan önemli bulguları temsil eden satırlar ve
sutunlar bir koşula bağlı olarak renklendirilerek vurgulanabilmelidir.
o Elde edilen sonuçlar kategorilerine göre ( tablo, grafik...) kendi içlerinde otomatik
olarak indekslenebilmeli, görünürlüğü değiştirilebilmeli ya da silinebilmelidir.
o Analitik sonuçların, tabloların, grafiklerin üzerine, ilgili çıktının üretildiği tarih,
oluşturan kullanıcı, ilgili sonucun alındığı prosedürün adı gibi detaylı bilgiler her
çıktıya ayrı ayrı otomatik olarak not şeklinde eklenebilmelidir.
o Koşullu şekillendirme seçeneği ile tablo içerisindeki değerler belirlenen bir ya da
birden çok koşula göre ayrı ayrı renklendirilerek tablo içerisinde görsel işaretlemeler
yapılabilmelidir.
o Tablolar içerisindeki belirlenen sütun değerlerine bağlı olarak tablo sıralaması
değiştirilebilmen, belirlenilen bir değer ya da değer aralığında yer alan tablo hücreleri
tespit edilebilmelidir.
Yardım Menüsü
*
İstatistik danışmanı, istatistik öğreticisi ile sonuçları yorumlama gibi dinamik yardım menusu
özelliklerine sahip olmalı. Bilinmeyen istatistik terimlerine çıktı üzerinden ulaşılabilmeli.
Analiz sonuçlarının yorumlan ve açıklaması analiz sonuçları üzerinden almabilmelidir,
*
Index özelliği ve Tutorial özelliği içermelidir.
*
Kullanıcıyı yönlendiren bir karşılama penceresi içermelidir.
Yapısal Eşitlik Modelleri Çözümü - Özellikler
*
Excel, IBM SPSS Statistics, Text, CSV, Access formatmda saklanan verilere erişebilmelidir.
*
Programın arayüzü üzerinden verileri gösterebilmelidir.
*
Modellemeyi interaktif bir arayüz üzerinden veya kod yazarak yapabilmelidir.
*
Aşağıdaki analizleri yapabilmelidir;
* Regresyon,
■ Keşifsel ve Doğrulayızı Faktör Analizi,
■ Genel Modeller (Faktör analizi ve regresyon analizini eş zamanlı olarak
modelleyebilmeli),
“ Bootstrapping yöntemini desteklemelidir,
■ Çoklu Grup Analizi yapabilmeli ve karşılıklı gruplarda bulunan parametreleri
test edebilmelidir,
* Nested modelleri analiz edebilmelidir,
■ Otomatik olarak oluşturulan parametre kısıtları ile doğrusal Growth Curve
modelleri incelebilmelİdir,
■ Ordinal ölçüm tipi ve sansürlü yapıyıdaki değişkenler
için Bayesyen
yaklaşımı ele alınarak tahminler oluşturulabilmelidir,
■ Markov Chain Moncte Carlo simülasyonu yapılabilmelidir,
■ Normal
veya
normal
dağılmayan
veri
ile
parametre
tahminleri
yapılabilmelidir,
*
Multivariate normallik ve outlier analizleri gerçekleştirilebilmelidir,
■ Boostrap yöntemi oluşturulan modellerin başarısını inceleyebilmelidir,
* Birden fazla grup ile çalışılırken her bir grup için farklı veri seti kullanılabilmelidir ve/veya
bir veri seti içerisinde yer alan farklı gruplar kod yazmadan tanıtılmalıdır.
* Oluşturulan model diyagramını kod yazmadan kopyalayabilmelidir.
* Visual Basic.NET ve C# dilinde kod yazma imkanı tanımalıdır.
* Oluşturulan model yapısı otomatik olarak Visual Basic.NET formatma aktarılabilir.
* Gözlenen ve latent (gözlenmeyen /gizil) değişkenler ile modeller oluşturulabilmelidir.
* Kullanıcının belirleyeceği uyum kriterlerine göre otomatik modeller oluşturmalı ve
kullanıcıya model başarılarını sunmalıdır.
* Sansürlü veri ile çalışabilmelidir.
* Kayıp göze barındıran veri setleri ile çalışabilmeli ve istendiği taktirde boş gözeleri
doldurabİlmelidir.
B.2. Tip2 İstatistiksel Paket Program Teknik Özellikleri
* Verinin ön analizinde kullanılan; Tanımlayıcı Oran İstatistikler (Descriptive Ratio Statistics
(PVA)),
Çapraz Tablolama (Crosstabs),
Keşifsel Analizler (Explore),
Tanımlayıcı
İstatistikler (Descriptive Statistics), Frekans Tablosu ve Veri Özetlemesi (Summarize Data)
işlemlerini yapabilmelidir.
* Bağımlı T-testi, iki bağımsız grubu karşılaştıran T-testi ve ikiden fazla bağımsız grubun
karşılaştırmasında kullanılan Tek Yönlü Varyans Analizini (ANOVA) yapabilmelidir.
* Korelasyon ve kısmi korelasyon işlemlerini yapabilmelidir.
* Kümeleme Analizlerini yapabilmeli. K-Means ve Hiyerarşik kümeleme analizlerini
yapabilmeli ve kategorik ve sürekli verilerde ve büyük veri setlerinde îki Aşamalı Kümeleme
Tekniğini (Two-Step Cluster) kullanmalıdır.
* Parametrik olmayan testleri (Non - Parametric Tests) içermelidir.
* Discriminant Analizi, Doğrusal ve Ordinal Regresyon Analizleri, Eğri Kestirme
(Curve
Estimation), Faktör Analizi, Çok Boyutlu Ölçekleme (ALSCAL Multidimensional Scaling),
Güvenilirlik (Reliability) ve En Yakın Komşu (Nearest Neighbor Analysis) analizlerini
yapabilmelidir.
* Pearson Ki-kare testi, Likelihood ratio test, Fisher’s exact test, Linear-by-linear association
test, Contingency coefficient, Phi, Cramer’s V, Goodman ve Kruskal Tau, Uncertainty
coefficient, Kappa, Gamma, Marginal homogeneity test, Jonckheere-Terpstra test, Wilcoxon
signed-rank test, Cochran's Q test, Binomial test gibi analizleri yapabilmelidir.
*
Sayısal hedef alanların tahmin edilmesinde Automatic Linear Model (ALM) algoritması ile
otomatik biçimde güçlü ve güvenilir doğrusal modeller oluşturabilmelidir.
*
Generalized Estimating Equations (GEE), General Linear Models (GLM), Generalized
Linear Mixed Models (GLMM), Generalized Linear Models (GZLM), Tekrarlı ölçümler için
GLM (GLM Repeated Measures) analizlerini yapabilmelidir.
*
Variance Component Analizi, Kovaryans Analizi (Covariance Analysis (ANCOVA)), Çok
Değişkenli Varyans Analizi (Multivariate Variance Analysis (MANOVA)) ve Çok değişkenli
Kovaryans Analizini (Multivariate Covariance Analysis (MANCOVA)) yapabilmelidir.
* General LogLinear Analizi, Logit LogLinear Analizi, Sağkalım Analizi (Survival Analysis),
Kaplan-Meier Sağkalım Analizi, Yaşam Tabloları (Life Tables) ve Cox Regresyon (Cox
Regression), analizlerini yapabilmelidir.
* Lojistik Regresyon, Multinomial Lojistik Regresyon, Probit Analizi, Doğrusal Olmayan
Regresyon, Ağırlık Tahmini (Weight Estimation), İki Aşamalı En küçük Kareler Regresyon
analizlerini yapabilmelidir.
* Komut dili ile kullanıcının kendi uygulamalarım geliştirmesine imkan vermelidir.
* Otomasyon özelliğine sahip olmalı, aynı veri dosyası üzerinde sürekli yapılan analizler için
menü kişiselleştirilebilmeli, menüye çalışma adına yeni alt menüler ilave edilebilmeli ve
yüzlerce analiz tek bir tuş ile erişilebilir hale getirilebilmelidir.
* Benzer analiz gruplarının otomatik olarak farklı veri yapılarına entegre edilmesini
sağlayabilmelidir.
* Önceden oluşturulan ve XML formatmda saklanabilen modellere bir ara yüz üzerinden
kolaylıkla erişilerek yeni gelen veriler skorlanabilmelidir.
Grafikler
* İstatistiksel en az 50 değişik yüksek çözünürlüklü grafik üretimi ve bunları değişik resim
formatlarmda saklayabilme özelliği olmalıdır. Auto ve çapraz korelasyon grafikleri, interaktif
grafikler, Chart galerisi olmalıdır.
* Üç boyutlu etkileşimli grafik alabilmeli, grafikleri interaktif olarak kullanabilmelidir.
* Çoklu grafik oluşturma dili ile isteğe uyarlanmış grafikler elde edilebilmelidir
* ROC analizleri yapabilmelidir.
!
*
Kategorik grafikler (bar, çizgi, alan, pasta, kutu çizimi vb); Serpme çizimler (Scatterplots:
Basit, gruplu, matrix, 3-D);
Yoğunluk çizimleri (popülasyon piramitleri, nokta çizimler,
histogramlar) olmalıdır
*
Kalite kontrol grafikleri (pareto, x-bar, yayılma alanı, sigma, bireysel grafik, hareket eden
aralık grafiği) içermelidir
*
Kalite kontrol uygulamalarında, ileri proses kontrol grafikleri ile analizleri yönetebilme ve
daha etkin olarak değişiklikleri izleyebilmeye imkan vermelidir.
*
Çoklu kullanım grafikleri (Çift Y eksenli ve overlay grafikler, 2 boyutlu çizgi grafikleri,
çoklu yamt kümeleri için grafikler) içermelidir
*
Coğrafi haritalar üzerinde grafikler üretilebilmelidir. Ayrıca ESRİ formatmdaki harita
dosyalarının kullanılmasına olanak sağlamalıdır.
Çıktı:
* Sonuçları HTML formatmda export edebilmeli. Active X teknolojisine sahip olmalı, output
scripting özelliği olmalı, sonuçlan word/excel/power point’e export edebilmelidir. Tabloları
grafiğe dönüştürebilmelidir. Draft Viewer, XML Formatmda Smart Score’a Model İhraç
Etme, Pivot Tablolar / OLAP Küpleri,
Output yönetim sistemi, Yeni değişken editörü
penceresi, Sıra kayıtların sürekli olmayacak şekilde çoklu seçimi özelliklerine sahip
olmalıdır.
* Birden çok değişkeni tek bir pivot tabloda gösterebilmek amacıyla stacking, nesting ve layers
yöntemlerini kullanabilmelidir.
* Tek bir pivot tabloda bir değişkenin kategorilerine ilişkin ara toplamlar verilebilmelidir.
Pivot
tablo
üzerinde
değişkenin
diğer
kategorileri
kullanılarak
yeni
kategoriler
oluşturulabilmelidir.
* Oluşturulan pivot tablolar, seçilen kategorik ve sayısal değişkenlere ilişkin Özet istatistikleri
(satır yüzdesi, sütun yüzdesi, ortalama, mod, medyan, standart sapma gibi) içermelidir,
* Pivot tablo üzerinde, satır ve sütun alanlarına atanan değişkenlerin arasında ilişki olup
olmadığını test etmek amacıyla uygun olan 3 farklı test istatistiğinden birini verebilmelidir.
* Çıktı dosyalar, “spv” formatmda kayıt edilebilmelidir.
* Ek ürün ile çıktılar, internet ve intranet ortamında yayınlanabilmelidir.
* Çıktıları PDF, Word, Excel ve power point’e aktarabilmelidir
15
9
£■
i
1
Yardım Menüsü
* İstatistik danışmanı, istatistik öğreticisi ile sonuçları yorumlama gibi dinamik yardım menusu
özelliklerine sahip olmalı. Bilinmeyen istatistik terimlerine çıktı üzerinden ulaşılabilmek.
Analiz sonuçlarıma yorumları ve açıklaması analiz sonuçları üzerinden alınabilmelidir.
* Index özelliği ve Tutorial özelliği içermelidir
B.3. Tıp3 İstatistiksel Paket Program Teknik Özellikleri
* Verinin ön analizinde kullanılan; Tanımlayıcı Oran İstatistikler (Descriptive Ratio Statistics
(PVA)),
Çapraz Tablo lama (Crosstabs), Keşifsel Analizler (Explore),
Tanımlayıcı
İstatistikler (Descriptive Statistics), Frekans Tablosu ve Veri Özetlemesi (Summarize Data)
işlemlerini yapabilmelidir.
* Bağımlı T-testi, iki bağımsız grubu karşılaştıran T-testi ve ikiden fazla bağımsız grubun
karşılaştırmasında kullanılan Tek Yönlü Varyans Analizini (ANOVA) yapabilmelidir.
* Korelasyon ve kısmi korelasyon işlemlerini yapabilmelidir.
* Kümeleme Analizlerini yapabilmeli. K-Means ve Hiyerarşik kümeleme analizlerini
yapabilmeli ve kategorik ve sürekli verilerde ve büyük veri setlerinde İki Aşamalı Kümeleme
Tekniğini (Two-Step Cluster) kullanmalıdır.
* Parametrik olmayan testleri (Non - Parametric Tests) içermelidir.
* Discriminant Analizi, Doğrusal ve Ordinal Regresyon Analizleri, Eğri Kestirme
(Curve
Estimation), Faktör Analizi, Çok Boyutlu Ölçekleme (ALSCAL Multidimensional Scaling),
Güvenilirlik (Reliability) ve En Yakın Komşu (Nearest Neighbor Analysis) analizlerini
yapabilmelidir.
* Pearson Ki-kare testi, Likelihood ratio test, Fisher's exact test, Linear-by-linear association
test, Contingency coefficient, Phi, Cramer's V, Goodman ve Kruskal Tau, Uncertainty
coefficient, Kappa, Gamma, Marginal homogeneity test, Jonckheere-Terpstra test, Wilcoxon
signed-rank test, Cochran's Q test, Binomial test gibi analizleri yapabilmelidir.
* Monte Carlo Simulasyon tekniği ile sİmulasyon yapılabilmelidir.
o Kurulan
modellerin
doğruluğunu
ve
başarısını
geliştirmek
adına
modelin
oluşturulduğu veri setinde yer alan alanlara uygun dağılımlar fit edilerek, her alan için
sentetik veriler simule edilebilmelidir,
o Herhangi bir model geliştirmeye ihtiyaç duymadan var olan veri setlerinde yer alan
sayısal ya da sayısal olmayan alanlara uygun dağılımlar fit edilerek her alan için
sentetik veriler simule edilebilmelidir.
*
Sayısal hedef alanların tahmin edilmesinde Automatic Linear Model (ALM) algoritması ile
otomatik biçimde güçlü ve güvenilir doğrusal modeller oluşturabilmelidir.
*
Komut dili ile kullanıcının kendi uygulamalarım geliştirmesine imkan vermelidir.
* Otomasyon özelliğine sahip olmalı, aynı veri dosyası üzerinde sürekli yapılan analizler için
menü kişi s elleştiril ebilmeli, menüye çalışma adına yeni alt menüler ilave edilebilmeli ve
yüzlerce analiz tek bir tuş ile erişilebilir hale getirilebilmelidir.
* Benzer analiz gruplarının otomatik olarak farklı veri yapılarına entegre edilmesini
sağlayabilmelidir.
* Önceden oluşturulan ve XML formatmda saklanabilen modellere bir ara yüz üzerinden
kolaylıkla erişilerek yeni gelen veriler skorlanabilmelidir.
* R ve Phyton açık kaynak kodlarıyla entegre olabilmelidir.
Grafikler
* İstatistiksel en az 50 değişik yüksek çözünürlüklü grafik üretimi ve bunları değişik resim
formatlarında saklayabilme özelliği olmalıdır. Auto ve çapraz korelasyon grafikleri, interaktif
grafikler, Chart galerisi olmalıdır.
* Üç boyutlu etkileşimli grafik alabilmeli, grafikleri interaktif olarak kullanabilmelidir.
* Çoklu grafik oluşturma dili ile isteğe uyarlanmış grafikler elde edilebilmelidir.
* ROC analizleri yapabilmelidir.
* Kategorik grafikler (bar, çizgi, alan, pasta, kutu çizimi vb); Serpme çizimler (Scatterplots:
Basit, gruplu, matrix, 3-D);
Yoğunluk çizimleri (popülasyon piramitleri, nokta çizimler,
histogramlar) olmalıdır.
* Kalite kontrol grafikleri (pareto, x-bar, yayılma alanı, sigma, bireysel grafik, hareket eden
aralık grafiği) içermelidir.
* Kalite kontrol uygulamalarında, ileri proses kontrol grafikleri ile analizleri yönetebilme ve
daha etkin olarak değişiklikleri izleyebilmeye imkan vermelidir.
* Çoklu kullanım grafikleri (Çift Y eksenli ve overlay grafikler, 2 boyutlu çizgi grafikleri,
çoklu yanıt kümeleri için grafikler) içermelidir.
* Coğrafi haritalar üzerinde grafikler üretilebilmelidir. Ayrıca ESRİ formatındaki harita
dosyalarının kullanılmasına olanak sağlamalıdır.
Çıktı:
* Çıktı dosyalar, “spv” formatında kayıt edilebilmelidir.
* Ek ürün ile çıktılar, internet ve intranet ortamında yaymlanabilmelidir.
* Elde edilen analitik sonuçlar, çıktılar, grafikler, tablolar PDF, Word, Excel ve Power Point’e
aktarabilmelidir. Aynı zamanda sonuçlar web raporu olarak export edilebilmeli, program
arayüzünü açmaya ve smartreader gibi ek bir ihtiyaç duymadan farklı platformlarda ve akıllı
cihazlarda sonuçlar görüntülenebilmelidir.
* Çıktılar üzerinde çeşitli değişiklikler yapılabilmelidir.
o Tablolar içerisindeki metinsel ifadeler ve sayıların yazı tipi, boyutu ve formatı
değiştirilebilmeli ve renklendirilebilmelidir. Tablonun genel formatı seçilen faiklı bir
format ile değiştirilebilmelidir.
o Analitik sonuçları içeren tablolarda yer alan önemli bulguları temsil eden satırlar ve
sutunlar bir koşula bağlı olarak renklendirilerek vurgulanabilmelidir.
o Elde edilen sonuçlar kategorilerine göre ( tablo, grafik...) kendi içlerinde otomatik
olarak indekslenebilmeli, görünürlüğü değiştirilebilmeli ya da silinebilmelidir.
o Analitik sonuçların, tabloların, grafiklerin üzerine, ilgili çıktının üretildiği tarih,
oluşturan kullanıcı, ilgili sonucun alındığı prosedürün adı gibi detaylı bilgiler her
çıktıya ayrı ayrı otomatik olarak not şeklinde eklenebilmelidir.
o Koşullu şekillendirme seçeneği ile tablo içerisindeki değerler belirlenen bir ya da
birden çok koşula göre ayrı ayrı renklendirilerek tablo içerisinde görsel işaretlemeler
yapılabilmelidir.
o Tablolar içerisindeki belirlenen sütun değerlerine bağlı olarak tablo sıralaması
değiştirilebilmeli, belirlenilen bir değer ya da değer aralığında yer alan tablo hücreleri
tespit edilebilmelidir.
Yardım Menüsü
*
İstatistik danışmanı, istatistik öğreticisi ile sonuçları yorumlama gibi dinamik yardım menusu
özelliklerine sahip olmalı. Bilinmeyen istatistik terimlerine çıktı üzerinden ulaşılabilmeli.
Analiz sonuçlarının yorumlan ve açıklaması analiz sonuçlan üzerinden ahnabilmelidir.
*
Index Özelliği ve Tutorial özelliği içermelidir
*
Kullanıcıyı yönlendiren bir karşılama penceresi içermelidir.
C,DESTEKLENEN PLATFORMLAR
* Gerektiğinde veri madenciliği ürünleri ile entegre çalışabilmelidir.
* Gerektiğinde kurumsal entegrasyon ürünleri ile entegre çalışabilmelidir.
* İşletim Sistemi: Microsoft Windows XP (Home, Professional, 32-bit veya 64-bit versiyon),
Vista® (Enterprise, Business, 32-bit veya 64-bit versiyon), Windows 7 (Enterprise, Home
Premium,
Professionals2-bit veya 64-bit versiyon) veya
Windows
8 (Enterprise,
Professional, Standart)
* Intel® or AMD x86 (1 GHz veya daha yükseği)
* Bellek: 1GB RAM veya daha fazlası
* Sürücüdeki minimum boş alan: 800MB
* DVD sürücü
* XGA (1024x768) veya daha yüksek çözünürlüklü ekran
* Server ile bağlantı için ağ bağdaştırıcısı TCP/IP network protokolü
* Ağ tarayıcısı: Internet Explorer 8 ve üstü
19
Download

T.C. SAĞLIK BAKANLIĞI TÜRKİYE HALK SAĞLIĞI KURUMU