実際の電話の方式は、概ねtakumiさんのご想像どおりかな、と私も思います。
問題は、録音にかける時間です。例えば、1秒間録音してから転送するとすると、話者の音声が聴者に届くまでに、転送遅延にプラスして1秒の遅延が発生することになるので、まるで会話にならない状況が想像されます。録音にかける時間を短くして、音声データをこま切れにして転送すれば、遅延は短くなりますが、反対に通信負荷が大きくなり、プチコンで処理できるかどうかが疑わしくなります。
トランシーバーのように、一方が話すときには、もう一方は聴くことしかできない方式(半二重通信方式)であれば、前述の遅延が問題になりにくいので、プチコンでも実現しやすいと思います。実際、プチコンでトランシーバーを作る検討をしているという話は聞いたことがありますが、残念ながら、実際に作ったという話は、現在までのところ、聞いていません。