HAL (Le Centre pour la Communication Scientifique Directe), 1985
Utilisant la notion de divergence entre deux mesures de probabilité nous nous intéressons, dans l... more Utilisant la notion de divergence entre deux mesures de probabilité nous nous intéressons, dans le cadre de l'analyse bayesienne, à la stabilité de l'information transmise par les observations sur l'espace paramètre dans le cas ou la famille de mesures de probabilité à priori est constituée par une famille contaminée. Nous en déduisons alors que, sous certaines conditions, les modèles contaminés normaux assurent une bonne transmission de l'information. MOTS CLES: Divergence, information, famille contaminée de mesures de probabilité a priori, analyse bayesienne, canal de transmission, stabilité de l'information transmise. Dans le contexte de l'analyse bayesienne, nous désirons dans cet article étudier, sur un exemple particulier (celui des mesures de probabilité contaminées) la notion de stabilité de l'information transmise. Plus précisément: étant donné un Espace paramètre, que l'on peut associer a une source d'information et étant donné un modèle statistique, que l'on peut associer à un canal de transmission, nous utiliserons la notion d'information afin d'étudier, dans le cadre des familles contaminées normales de mesures de probabilité a priori, la variation, en fonction du paramètre de contamination, de l'information transmise par les observations sur l'espace paramètre, ce qui nous permettra d'apprécier la robustesse de ces modèles par rapport à ce dernier concept. 1.
Soit (X, Y) un vecteur aléatoire de R 2 et soient respectivement ξ p , ξ q et η r , η s les quant... more Soit (X, Y) un vecteur aléatoire de R 2 et soient respectivement ξ p , ξ q et η r , η s les quantiles d'ordres p et q (p > q) et d'ordres r et s (r > s) des composantes X et Y. On s'intéresse alors, en tant qu'indice relatif de dispersion, au rapport (ξp−ξq) 2 (η r −η s) 2 et l'on montre que le rapport empirique correspondant est, pour ce dernier, un estimateur asymptotiquement normal, sans biais et convergent et qu'en outre il peut dans certains cas représenter, pour le rapport des variances σ 2 X σ 2 Y , un estimateur concurrent du rapport des variances empiriques. Quelques simulations illustrent les résultats de normalité asymptotique et permettent de comparer les deux estimateurs.
... processus d'exploration est it~re afin d'obtenir une estimation du plus court-circu... more ... processus d'exploration est it~re afin d'obtenir une estimation du plus court-circuit. La proprifte mentionn~e semblerait intuitivement g~n~rale. ... (tsis - F. IS. (tis .) fZ* (t) dt> 0 o fz* (C.) -00 0 J J designe la loi commune de Z1, Z2, .... Zk, alors: P. ~P.. En effet: ...
HAL (Le Centre pour la Communication Scientifique Directe), 2003
In order to extend the relative risk or efficiency concept to random quantities for which varianc... more In order to extend the relative risk or efficiency concept to random quantities for which variances does not exist, we consider, as an alternative to variances ratio, the interquantiles range ratio. Moreover, even in the case of finite variances, the sample interquantiles range ratio may be prefer to the sample variances ratio for robustness reasons. We show, in this paper, that the sample interquantiles range ratio is an asymptotically normal, unbiaised and consistant estimator of the corresponding theoretical interquantiles range ratio and we empirically check its asymptotic normality, as the effect of outliers on its behaviour, by means of simulations. Keywords : Bidimensional probability measures, quantile différences ratio, copula, asymptotic normality. Résumé Afin d'étendre la notion de risque relatif ou d'efficacité relative au cas de deux quantités aléatoires dont les variances n'existent pas, on considère en tant qu'alternative au rapport des variances, le rapport des étendues interquantiles. Par ailleurs, même dans le cas où les variances existent, la présence dans les données de valeurs aberrantes peut inciter pour des raisons de robustesse, à préférer le rapport des étendues interquantiles empiriques à celui des variances empiriques. On montre alors dans ce qui suit, que le rapport des étendues interquantiles empiriques est, pour le rapport théorique correspondant, asymptotiquement normal, sans biais et convergent. Quelques simulations illustrent enfin la normalité asymptotique de ce dernier ainsi que son comportement en présence de valeurs aberrantes. Mots-clés : Loi bidimensionnelle, rapport des étendues interquantiles, copules, loi asymptotique.
ABSTRACT Our intentions is to simply show the usefulness of certain classic statistical tools in ... more ABSTRACT Our intentions is to simply show the usefulness of certain classic statistical tools in domains where such tools are rarely used. Certain of these tools bring about a new vision of a set of complex objects or systems: we have chosen, as a first step, to illustrate their potential on a simple set of micro-processors. It would be possible, in a further step, to apply those same techniques in other domains of computer science, in particular in the field of software metrics.The paper is divided in two parts: (1) Illustation of the techniques, through a practical example, which permit to reveal the essential characteristics of a family of micro-processors. (2) A short theorical summary of the statistical tools used.
ABSTRACT Based on the notion of mutual information between the components of a random vector, we ... more ABSTRACT Based on the notion of mutual information between the components of a random vector, we construct, for data reduction reasons, an optimal quantization of the support of its probability measure. More precisely, we propose a simultaneous discretization of the whole set of the components of the random vector which takes into account, as much as possible, the stochastic dependence between them. Examples are presented.
41èmes Journées de Statistique, SFdS, Bordeaux, 2009
Étant donné n vecteurs aléatoires X 1 ; X 2 ; :::; X n de dimensions …nies, on considère le test ... more Étant donné n vecteurs aléatoires X 1 ; X 2 ; :::; X n de dimensions …nies, on considère le test semi-paramétrique d'indépendance entre ces derniers tel que présenté dans Colin et Monga (2007, 2008). Après en avoir illustré son usage sur quelques exemples et avoir mis en évidence de façon empirique sa puissance, dans le cas de quelques hypothèses alternatives, on se propose dans un cadre plus théorique de montrer que ce test est asymptotiquement sans biais et qu'il est de plus asymptotiquement équivalent au test du rapport de vraisemblance dans le cadre d'une hypothèse alternative particulière, choix dicté par la di¢ culté que l'on rencontre dans ce cas précis pour décrire de façon pratique et réaliste l'hypothèse alternative.
Distance measures like the Euclidean distance have been the most widely used to measure similarit... more Distance measures like the Euclidean distance have been the most widely used to measure similarities between feature vectors in the content-based image retrieval (CBIR) systems. However, in these similarity measures no assumption is made about the probability distributions and the local relevances of the feature vectors. Therefore, irrelevant features might hurt retrieval performance. Probabilistic approaches have proven to be an effective solution to this CBIR problem. In this paper, we use a Bayesian logistic regression model, in order to compute the weights of a pseudo-metric to improve its discriminatory capacity and then to increase image retrieval accuracy. The pseudo-metric weights were adjusted by the classical logistic regression model in [Ksantini et al., 2006]. The Bayesian logistic regression model was shown to be a significantly better tool than the classical logistic regression one to improve the retrieval performance. The retrieval method is fast and is based on feature selection. Experimental results are reported on the Zubud and WANG color image databases proposed by [Deselaers et al., 2004].
The linear discriminant analysis (LDA) is a linear classifier which has proven to be powerful and... more The linear discriminant analysis (LDA) is a linear classifier which has proven to be powerful and competitive compared to the main state-of-the-art classifiers. However, the LDA algorithm assumes the sample vectors of each class are generated from underlying multivariate normal distributions of common covariance matrix with different means (i.e., homoscedastic data). This assumption has restricted the use of LDA considerably. Over the years, authors have defined several extensions to the basic formulation of LDA. One such method is the heteroscedastic LDA (HLDA) which is proposed to address the heteroscedasticity problem. Another method is the nonparametric DA (NDA) where the normality assumption is relaxed. In this paper, we propose a novel Bayesian logistic discriminant (BLD) model which can address both normality and heteroscedasticity problems. The normality assumption is relaxed by approximating the underlying distribution of each class with a mixture of Gaussians. Hence, the proposed BLD provides more flexibility and better classification performances than the LDA, HLDA and NDA. A subclass and multinomial versions of the BLD are proposed. The posterior distribution of the BLD model is elegantly approximated by a tractable Gaussian form using variational transformation and Jensen's inequality, allowing a straightforward computation of the weights. An extensive comparison of the BLD to the LDA, support vector machine (SVM), HLDA, NDA and subclass discriminant analysis (SDA), performed on artificial and real data sets, has shown the advantages and superiority of our proposed method. In particular, the experiments on face recognition have clearly shown a significant improvement of the proposed BLD over the LDA.
IEEE Transactions on Pattern Analysis and Machine Intelligence, Feb 1, 2008
Distance measures like the nearest neighbor rule distance and the Euclidean distance have been th... more Distance measures like the nearest neighbor rule distance and the Euclidean distance have been the most widely used to measure similarities between feature vectors in the content-based image retrieval (CBIR) systems. However, in these similarity measures no assumption is made about the probability distributions and the local relevances of the feature vectors, thereby irrelevant features might hurt retrieval performance. Probabilistic approaches have proven to be an effective solution to this CBIR problem. In this paper, we use a Bayesian logistic regression model based on a variational method, in order to compute the weights of a pseudo-metric, to improve its discriminatory capacity and then to increase image retrieval accuracy. This pseudo-metric makes use of the compressed and quantized versions of the Daubechies-8 wavelet decomposed feature vectors, and its weights were adjusted by the classical logistic regression. The evaluation and comparison of the Bayesian logistic regression model and the classical logistic regression one are performed independently of and in image retrieval context. Experimental results show that the Bayesian logistic regression model is a significantly better tool than the classical logistic regression model to compute the pseudo-metric weights and to improve the retrieval and classification performances.
HAL (Le Centre pour la Communication Scientifique Directe), 2007
Etant donnée une mesure de probabilité /x définie sur (Rn, Bun), absolument continue par rapport ... more Etant donnée une mesure de probabilité /x définie sur (Rn, Bun), absolument continue par rapport à une mesure de référence, on considère la variable aléatoire Z = (•) où les jûp'f = 1,2désignent les mesures de probabilité marginales déduites de /x. On montre alors que la statistique Z suit une loi non paramétrique et l'on utilise cette propriété afin de construire un test d'indépendance entre les composantes du vecteur aléatoire de loi fi. Enfin quelques exemples illustrent la procédure de test utilisé.
International Conference on Computer Vision and Graphics, Feb 1, 2006
ABSTRACT In this paper, a simple and fast querying method for content-based image retrieval is pr... more ABSTRACT In this paper, a simple and fast querying method for content-based image retrieval is presented. In order to measure the similarity degree between two color images both quickly and effectively, we use a weighted pseudo-metric employing one-dimensional Daubechies decomposition and compression of the extracted feature vectors. In order to improve the discriminatory capacity of the pseudo-metric, we compute its weights using separately a classical logistic regression model and a Bayesian logistic regression model. The Bayesian logistic regression model was shown to be significantly better than the classical logistic regression model at improving the retrieval performance. Experimental results are reported on the WANG and ZuBuD color image databases proposed by [11].
Notant la sensibilite particuliere aux donnees aberrantes de l'estimateur usuel du rapport de... more Notant la sensibilite particuliere aux donnees aberrantes de l'estimateur usuel du rapport de deux moyennes, on considere comme alternative, afin de pallier cette situation, le quotient de deux medianes et plus generalement le quotient de deux quantiles. On montre que ce dernier est, pour le rapport des quantiles theoriques, un estimateur asymptotiquement normal, sans biais et convergent. Des simulations montrent que le rapport des medianes, en tant qu'estimateur du rapport des moyennes, se compare fort bien a des estimateurs de type Hodges-Lehmann ou a des estimateurs construits a l'aide du rapport de moyennes tronquees ou censurees et qu'il est, par ailleurs, moins sensible aux donnees aberrantes que le quotient des moyennes empiriques.
Étant donné n vecteurs aléatoires X1,X2,...,Xn de dimensions finies, on considère le test semi-pa... more Étant donné n vecteurs aléatoires X1,X2,...,Xn de dimensions finies, on considère le test semi-paramétrique d'indépendance entre ces derniers tel que présenté dans Colin et Monga (2009). Après en avoir illustré son usage sur quelques exemples et avoir mis en évidence de façon empirique sa puissance, on se propose alors dans un cadre plus théorique, de montrer que ce test est naturellement associé à un pont brownien, ce qui permet ainsi, dans le cas de certaines formes d'hypothèses alternatives de décrire plus aisément son comportement asymptotique. Enfin, on comparera au niveau de l'efficacité relative, le test proposé au test du rapport de vraisemblance dans le cadre de certains modèles paramétriques donnés. Bibliographie [1] Bernard Colin et Ernest Monga (2009) : Efficacité d'un test semi-paramétrique d'indépendance entre vecteurs aléatoires, Congrès de la SFdS : 41e Journées de Statistique (Bordeaux).
Etant donnee une mesure de probabilite μ definie sur (R n , B R n), absolument continue par rappo... more Etant donnee une mesure de probabilite μ definie sur (R n , B R n), absolument continue par rapport a une mesure de reference, on considere la variable aleatoire Z = ⊕ ι=n ι=1 μ i (·) ou les μ i i = 1,2,...,n designent les mesures de probabilite marginales deduites de μ. On montre alors que la statistique Z suit une loi non parametrique et l'on utilise cette propriete afin de construire un test d'independance entre les composantes du vecteur aleatoire de loi p. Enfin quelques exemples illustrent la procedure de test utilise.
In this paper, a simple and fast querying method for content-based image retrieval is presented. ... more In this paper, a simple and fast querying method for content-based image retrieval is presented. In order to measure the similarity degree between two color images both quickly and effectively, we use a weighted pseudo-metric employing one-dimensional Daubechies decomposition and compression of the extracted feature vectors. In order to improve the discriminatory capacity of the pseudo-metric, we compute its weights using separately a classical logistic regression model and a Bayesian logistic regression model. The Bayesian logistic regression model was shown to be significantly better than the classical logistic regression model at improving the retrieval performance. Experimental results are reported on the WANG and ZuBuD color image databases proposed by [11].
HAL (Le Centre pour la Communication Scientifique Directe), 1985
Utilisant la notion de divergence entre deux mesures de probabilité nous nous intéressons, dans l... more Utilisant la notion de divergence entre deux mesures de probabilité nous nous intéressons, dans le cadre de l'analyse bayesienne, à la stabilité de l'information transmise par les observations sur l'espace paramètre dans le cas ou la famille de mesures de probabilité à priori est constituée par une famille contaminée. Nous en déduisons alors que, sous certaines conditions, les modèles contaminés normaux assurent une bonne transmission de l'information. MOTS CLES: Divergence, information, famille contaminée de mesures de probabilité a priori, analyse bayesienne, canal de transmission, stabilité de l'information transmise. Dans le contexte de l'analyse bayesienne, nous désirons dans cet article étudier, sur un exemple particulier (celui des mesures de probabilité contaminées) la notion de stabilité de l'information transmise. Plus précisément: étant donné un Espace paramètre, que l'on peut associer a une source d'information et étant donné un modèle statistique, que l'on peut associer à un canal de transmission, nous utiliserons la notion d'information afin d'étudier, dans le cadre des familles contaminées normales de mesures de probabilité a priori, la variation, en fonction du paramètre de contamination, de l'information transmise par les observations sur l'espace paramètre, ce qui nous permettra d'apprécier la robustesse de ces modèles par rapport à ce dernier concept. 1.
Soit (X, Y) un vecteur aléatoire de R 2 et soient respectivement ξ p , ξ q et η r , η s les quant... more Soit (X, Y) un vecteur aléatoire de R 2 et soient respectivement ξ p , ξ q et η r , η s les quantiles d'ordres p et q (p > q) et d'ordres r et s (r > s) des composantes X et Y. On s'intéresse alors, en tant qu'indice relatif de dispersion, au rapport (ξp−ξq) 2 (η r −η s) 2 et l'on montre que le rapport empirique correspondant est, pour ce dernier, un estimateur asymptotiquement normal, sans biais et convergent et qu'en outre il peut dans certains cas représenter, pour le rapport des variances σ 2 X σ 2 Y , un estimateur concurrent du rapport des variances empiriques. Quelques simulations illustrent les résultats de normalité asymptotique et permettent de comparer les deux estimateurs.
... processus d'exploration est it~re afin d'obtenir une estimation du plus court-circu... more ... processus d'exploration est it~re afin d'obtenir une estimation du plus court-circuit. La proprifte mentionn~e semblerait intuitivement g~n~rale. ... (tsis - F. IS. (tis .) fZ* (t) dt> 0 o fz* (C.) -00 0 J J designe la loi commune de Z1, Z2, .... Zk, alors: P. ~P.. En effet: ...
HAL (Le Centre pour la Communication Scientifique Directe), 2003
In order to extend the relative risk or efficiency concept to random quantities for which varianc... more In order to extend the relative risk or efficiency concept to random quantities for which variances does not exist, we consider, as an alternative to variances ratio, the interquantiles range ratio. Moreover, even in the case of finite variances, the sample interquantiles range ratio may be prefer to the sample variances ratio for robustness reasons. We show, in this paper, that the sample interquantiles range ratio is an asymptotically normal, unbiaised and consistant estimator of the corresponding theoretical interquantiles range ratio and we empirically check its asymptotic normality, as the effect of outliers on its behaviour, by means of simulations. Keywords : Bidimensional probability measures, quantile différences ratio, copula, asymptotic normality. Résumé Afin d'étendre la notion de risque relatif ou d'efficacité relative au cas de deux quantités aléatoires dont les variances n'existent pas, on considère en tant qu'alternative au rapport des variances, le rapport des étendues interquantiles. Par ailleurs, même dans le cas où les variances existent, la présence dans les données de valeurs aberrantes peut inciter pour des raisons de robustesse, à préférer le rapport des étendues interquantiles empiriques à celui des variances empiriques. On montre alors dans ce qui suit, que le rapport des étendues interquantiles empiriques est, pour le rapport théorique correspondant, asymptotiquement normal, sans biais et convergent. Quelques simulations illustrent enfin la normalité asymptotique de ce dernier ainsi que son comportement en présence de valeurs aberrantes. Mots-clés : Loi bidimensionnelle, rapport des étendues interquantiles, copules, loi asymptotique.
ABSTRACT Our intentions is to simply show the usefulness of certain classic statistical tools in ... more ABSTRACT Our intentions is to simply show the usefulness of certain classic statistical tools in domains where such tools are rarely used. Certain of these tools bring about a new vision of a set of complex objects or systems: we have chosen, as a first step, to illustrate their potential on a simple set of micro-processors. It would be possible, in a further step, to apply those same techniques in other domains of computer science, in particular in the field of software metrics.The paper is divided in two parts: (1) Illustation of the techniques, through a practical example, which permit to reveal the essential characteristics of a family of micro-processors. (2) A short theorical summary of the statistical tools used.
ABSTRACT Based on the notion of mutual information between the components of a random vector, we ... more ABSTRACT Based on the notion of mutual information between the components of a random vector, we construct, for data reduction reasons, an optimal quantization of the support of its probability measure. More precisely, we propose a simultaneous discretization of the whole set of the components of the random vector which takes into account, as much as possible, the stochastic dependence between them. Examples are presented.
41èmes Journées de Statistique, SFdS, Bordeaux, 2009
Étant donné n vecteurs aléatoires X 1 ; X 2 ; :::; X n de dimensions …nies, on considère le test ... more Étant donné n vecteurs aléatoires X 1 ; X 2 ; :::; X n de dimensions …nies, on considère le test semi-paramétrique d'indépendance entre ces derniers tel que présenté dans Colin et Monga (2007, 2008). Après en avoir illustré son usage sur quelques exemples et avoir mis en évidence de façon empirique sa puissance, dans le cas de quelques hypothèses alternatives, on se propose dans un cadre plus théorique de montrer que ce test est asymptotiquement sans biais et qu'il est de plus asymptotiquement équivalent au test du rapport de vraisemblance dans le cadre d'une hypothèse alternative particulière, choix dicté par la di¢ culté que l'on rencontre dans ce cas précis pour décrire de façon pratique et réaliste l'hypothèse alternative.
Distance measures like the Euclidean distance have been the most widely used to measure similarit... more Distance measures like the Euclidean distance have been the most widely used to measure similarities between feature vectors in the content-based image retrieval (CBIR) systems. However, in these similarity measures no assumption is made about the probability distributions and the local relevances of the feature vectors. Therefore, irrelevant features might hurt retrieval performance. Probabilistic approaches have proven to be an effective solution to this CBIR problem. In this paper, we use a Bayesian logistic regression model, in order to compute the weights of a pseudo-metric to improve its discriminatory capacity and then to increase image retrieval accuracy. The pseudo-metric weights were adjusted by the classical logistic regression model in [Ksantini et al., 2006]. The Bayesian logistic regression model was shown to be a significantly better tool than the classical logistic regression one to improve the retrieval performance. The retrieval method is fast and is based on feature selection. Experimental results are reported on the Zubud and WANG color image databases proposed by [Deselaers et al., 2004].
The linear discriminant analysis (LDA) is a linear classifier which has proven to be powerful and... more The linear discriminant analysis (LDA) is a linear classifier which has proven to be powerful and competitive compared to the main state-of-the-art classifiers. However, the LDA algorithm assumes the sample vectors of each class are generated from underlying multivariate normal distributions of common covariance matrix with different means (i.e., homoscedastic data). This assumption has restricted the use of LDA considerably. Over the years, authors have defined several extensions to the basic formulation of LDA. One such method is the heteroscedastic LDA (HLDA) which is proposed to address the heteroscedasticity problem. Another method is the nonparametric DA (NDA) where the normality assumption is relaxed. In this paper, we propose a novel Bayesian logistic discriminant (BLD) model which can address both normality and heteroscedasticity problems. The normality assumption is relaxed by approximating the underlying distribution of each class with a mixture of Gaussians. Hence, the proposed BLD provides more flexibility and better classification performances than the LDA, HLDA and NDA. A subclass and multinomial versions of the BLD are proposed. The posterior distribution of the BLD model is elegantly approximated by a tractable Gaussian form using variational transformation and Jensen's inequality, allowing a straightforward computation of the weights. An extensive comparison of the BLD to the LDA, support vector machine (SVM), HLDA, NDA and subclass discriminant analysis (SDA), performed on artificial and real data sets, has shown the advantages and superiority of our proposed method. In particular, the experiments on face recognition have clearly shown a significant improvement of the proposed BLD over the LDA.
IEEE Transactions on Pattern Analysis and Machine Intelligence, Feb 1, 2008
Distance measures like the nearest neighbor rule distance and the Euclidean distance have been th... more Distance measures like the nearest neighbor rule distance and the Euclidean distance have been the most widely used to measure similarities between feature vectors in the content-based image retrieval (CBIR) systems. However, in these similarity measures no assumption is made about the probability distributions and the local relevances of the feature vectors, thereby irrelevant features might hurt retrieval performance. Probabilistic approaches have proven to be an effective solution to this CBIR problem. In this paper, we use a Bayesian logistic regression model based on a variational method, in order to compute the weights of a pseudo-metric, to improve its discriminatory capacity and then to increase image retrieval accuracy. This pseudo-metric makes use of the compressed and quantized versions of the Daubechies-8 wavelet decomposed feature vectors, and its weights were adjusted by the classical logistic regression. The evaluation and comparison of the Bayesian logistic regression model and the classical logistic regression one are performed independently of and in image retrieval context. Experimental results show that the Bayesian logistic regression model is a significantly better tool than the classical logistic regression model to compute the pseudo-metric weights and to improve the retrieval and classification performances.
HAL (Le Centre pour la Communication Scientifique Directe), 2007
Etant donnée une mesure de probabilité /x définie sur (Rn, Bun), absolument continue par rapport ... more Etant donnée une mesure de probabilité /x définie sur (Rn, Bun), absolument continue par rapport à une mesure de référence, on considère la variable aléatoire Z = (•) où les jûp'f = 1,2désignent les mesures de probabilité marginales déduites de /x. On montre alors que la statistique Z suit une loi non paramétrique et l'on utilise cette propriété afin de construire un test d'indépendance entre les composantes du vecteur aléatoire de loi fi. Enfin quelques exemples illustrent la procédure de test utilisé.
International Conference on Computer Vision and Graphics, Feb 1, 2006
ABSTRACT In this paper, a simple and fast querying method for content-based image retrieval is pr... more ABSTRACT In this paper, a simple and fast querying method for content-based image retrieval is presented. In order to measure the similarity degree between two color images both quickly and effectively, we use a weighted pseudo-metric employing one-dimensional Daubechies decomposition and compression of the extracted feature vectors. In order to improve the discriminatory capacity of the pseudo-metric, we compute its weights using separately a classical logistic regression model and a Bayesian logistic regression model. The Bayesian logistic regression model was shown to be significantly better than the classical logistic regression model at improving the retrieval performance. Experimental results are reported on the WANG and ZuBuD color image databases proposed by [11].
Notant la sensibilite particuliere aux donnees aberrantes de l'estimateur usuel du rapport de... more Notant la sensibilite particuliere aux donnees aberrantes de l'estimateur usuel du rapport de deux moyennes, on considere comme alternative, afin de pallier cette situation, le quotient de deux medianes et plus generalement le quotient de deux quantiles. On montre que ce dernier est, pour le rapport des quantiles theoriques, un estimateur asymptotiquement normal, sans biais et convergent. Des simulations montrent que le rapport des medianes, en tant qu'estimateur du rapport des moyennes, se compare fort bien a des estimateurs de type Hodges-Lehmann ou a des estimateurs construits a l'aide du rapport de moyennes tronquees ou censurees et qu'il est, par ailleurs, moins sensible aux donnees aberrantes que le quotient des moyennes empiriques.
Étant donné n vecteurs aléatoires X1,X2,...,Xn de dimensions finies, on considère le test semi-pa... more Étant donné n vecteurs aléatoires X1,X2,...,Xn de dimensions finies, on considère le test semi-paramétrique d'indépendance entre ces derniers tel que présenté dans Colin et Monga (2009). Après en avoir illustré son usage sur quelques exemples et avoir mis en évidence de façon empirique sa puissance, on se propose alors dans un cadre plus théorique, de montrer que ce test est naturellement associé à un pont brownien, ce qui permet ainsi, dans le cas de certaines formes d'hypothèses alternatives de décrire plus aisément son comportement asymptotique. Enfin, on comparera au niveau de l'efficacité relative, le test proposé au test du rapport de vraisemblance dans le cadre de certains modèles paramétriques donnés. Bibliographie [1] Bernard Colin et Ernest Monga (2009) : Efficacité d'un test semi-paramétrique d'indépendance entre vecteurs aléatoires, Congrès de la SFdS : 41e Journées de Statistique (Bordeaux).
Etant donnee une mesure de probabilite μ definie sur (R n , B R n), absolument continue par rappo... more Etant donnee une mesure de probabilite μ definie sur (R n , B R n), absolument continue par rapport a une mesure de reference, on considere la variable aleatoire Z = ⊕ ι=n ι=1 μ i (·) ou les μ i i = 1,2,...,n designent les mesures de probabilite marginales deduites de μ. On montre alors que la statistique Z suit une loi non parametrique et l'on utilise cette propriete afin de construire un test d'independance entre les composantes du vecteur aleatoire de loi p. Enfin quelques exemples illustrent la procedure de test utilise.
In this paper, a simple and fast querying method for content-based image retrieval is presented. ... more In this paper, a simple and fast querying method for content-based image retrieval is presented. In order to measure the similarity degree between two color images both quickly and effectively, we use a weighted pseudo-metric employing one-dimensional Daubechies decomposition and compression of the extracted feature vectors. In order to improve the discriminatory capacity of the pseudo-metric, we compute its weights using separately a classical logistic regression model and a Bayesian logistic regression model. The Bayesian logistic regression model was shown to be significantly better than the classical logistic regression model at improving the retrieval performance. Experimental results are reported on the WANG and ZuBuD color image databases proposed by [11].
Uploads
Papers by Bernard Colin