Monday, February 5, 2007

How to test two data sets from the same distribution?

Suppose I have two data sets, how can I tell that they are from two distributions? what's the difference of these two data sets?

This is actually very generic question emerged in machine learning.

Some intuitive ideas:
1. estimate the density of data samples for each data set. This method might be very weak. In reality, density estimation is a very difficult task compared with "simple classification". This approach is generally not application in reality.

2. Estimate the sufficient statistics of each data set. Like the mean, variance of each feature, the class conditional distribution. This can be interpreted as analogy in cognition. An analogy can be derived if the relationship between multiple symbols can be maintained. The problem is when can we conclude that the difference is large enough? It seems some hypothesis testing is required.

3. Transformation. A data set can be transformed into another data set. But how do you know the feature mapping? A more reasonable way is to enforce equivalence of sufficient statistics in a newly generated space.

4. Dimensionality reduction. Assume that two data set shared the same distribution on a fixed number of dimensions. By projecting the two data set into those dimensions, probably we can find some interesting patterns.

5. Learn the classification function. Use the decision function to measure the difference. this is quite related to transfer learning.

6. Any other ways?

OK. To endeavor this direction, where can we find the data set?

The approach of Kernel Maximum Mean discrepancy might be related.

3 comments:

Anonymous said...

[url=][/url]

Anonymous said...

4909.....64787

Anonymous said...






Всем приветцы %-)



Братцы, плиз, дайте суьективно-обьективную оценку подарку!



Цель: Одарить 19-ти летнюю девушку подарков. Отношения с девушкой - около 2-х месяцев.



Вот собсна думал ту на досуге, чем бы одарить сие создание, просто чтобы оказать знак внимания.



Сначала хотел подарить последние духи БОСС, но сначала подумал что сие есть максимум - банальности, а потом с юмором узнал что сестра у нее в парфумерном магазине работает - и духов навалом дома.



Вот-с. Начал по инету шариться в поисках необычного подарка, и друг дал наводку, на игрушку Детский садик ))))



вобщем обьект представляет из себя класического плюшевого мишку размером где-то сантиметров 30..... но фишка в том, что в этого "мишутку" каким-то образом встроенно что-то типа пульта для телевизора.



ВОт собсна я и думаю, с одной стороны, такого мишку я больше ни у кого и ни в каких магазинах не видел....... с другой стороны, вроде как и возраст не тот... девушке ведь уже под 20-ть....





Собсна вопрос такой, считаете ли Вы что такой подарок может вызвоть (пускай скрытое) но неодобрение из-за возвраста человека?





Или же вы считаете, что такие подарки класика как духи\конфеты\плюшевые мишки всегда и везде ценились дамами?
[url=http://mp3lists.ru/][color=#E4F4FE] [/color][/url]