ফিজিক্স আর বায়োলজির অপূর্ব এক মেলবন্ধন লুকিয়ে আছে এই প্রশ্নের উত্তরে। আপনি যখন কোন শব্দ করেন, তখন ভোকাল কর্ডের কম্পন থেকে উৎপন্ন শব্দ তরঙ্গ, দুইটি পৃথক মাধ্যমে আপনার কানের পর্দায় আঘাত করে। একটা হলো মুখ থেকে বের হয়ে বায়ু মাধ্যমে, আরেকটা সরাসরি আপনার ভোকাল কর্ড হয়ে শরীরের ভেতর দিয়ে। সুতরাং দুইটা তরঙ্গ আপনার কানে পৌছানোর পর কম্পনের যোগফল আপনার ব্রেইন রিসিভ করে এবং এটাই আপনি "শোনেন"। ব্রেইন আপনার এই ভয়েসটাই মনে রাখে। কিন্তু আপনি যখন ভয়েস রেকর্ড করেন, তখন আপনার শরীর ভেদ করে যাওয়া তরঙ্গতো আর ডিভাইস রিসিভ করে না। সে শুধু বায়ু মাধ্যমে আসা তরঙ্গ সংগ্রহ করে। তাই আপনি যখন রেকর্ডেড ভয়েস শোনেন, তখন ব্রেইন নিজের আসল ভয়েসকে চিনতে পারে না বিধায় কনফিউসড হয়ে যায় এবং আপনার আনইজি ফিল হয়। এই সাইকোলজিকাল জিনিসটাকে পাঠ্য বইয়ে বলে voice confrontation. কিন্তু রেকর্ডেড ভয়েসে আপনাকে যেমন শোনা যায়, সেটাই কিন্তু আপনার আসল ভয়েস। কারণ মানুষ সেই ভয়েসটাই শোনে যার যার কান দিয়ে।